达梦数据40余年来始终坚持自主研发、原始创新,坚持高水平科技自立、自强,致力于推动国产数据库走向更广阔的应用天地。近日,在2023达梦数字产业大会现场,中国移动集团首席专家杨慰民带来了《以自主研发推进大数据核心数据库自主可控》主题演讲。
达梦数据
以下为中国移动集团首席专家杨慰民现场演讲内容:
在我做系统之前,有人说达梦OLTP做得不错,我今天跟大家分享的是,其实达梦做的OLAP在福建移动也解决了不少问题。
福建移动O域主动运维系统
首先,给大家分享的是福建移动O域主动运维系统。为什么叫主动运维系统?我们在过去十年时间里建了一套系统,叫做主动运维系统。相对过去的被动运维系统,它能先于客户投诉,先于设备告警,我的系统能先发现问题,并且把问题解决了,才实现主动运维的目标。我们带领团队,把我们这套系统的整个理论体系、核心算法和所有代码全都自主做出来了,所以我被评为中国移动的首席专家。当然,这套主动运维系统底层也需要一个强大的数据处理和计算平台,这也就是我们与达梦合作的技术方向。
在这个系统当中,应用超过1000个,全部的应用是百分之百我们自己独立完成。这个是我们的核心。福建移动的这套系统一天处理1.5万亿行、550T的数据。每天新增这么大的数据,对什么数据库都是一个巨大的挑战。这么大的数据量过来,包括数据怎么进数据库,如何查它的记录,都是难题。
从应用100%自研到软件全栈国产化演进
从2019年开始,我们用达梦的分布式数据库换掉Teradata AsterDB。去年开始,又用达梦的分布式数据库换掉了GP(EMC)。截至到当前,我们用达梦数据库又要替换掉全部应用层的关系数据库。整个过程,代码迁移仅花了一个月左右的时间,一个月完成1000个以上应用系统的迁移。
数据现状及进口数据库弊端
当前数据现状是计算复杂度非常高,核心数据层每天日均核心计算任务40000项。进口数据库自主性差、应用成本性高、故障多。使用国外数据库,经常会有定期重启的问题,以及经常出现头接尾的问题。例如,往往昨天数据,一直算到今天晚上才能算得完。如果昨天数据还没算完,新数据又来了,那这个应用只好放弃了,这就是非常大的一个矛盾。对于应用层的关系数据库,它的处理能力也是要求非常高的,替换之后既要支撑应用,也需要参与部分大数据数据计算,还存在大量跨库数据的处理。
从核心层到应用层数据库国产化改造
核心层OLAP数据库国产化迁移。在这个过程当中,我们以当前结果回看过去几年,当时我们为什么敢用达梦的OLAP?之前用国外数据库,经常重启,数据出不来。后面,把每天运行足够长的,如每天超过12小时甚至达到13小时的应用,备份一份数据到达梦上面。
刚开始,达梦的处理效率和国外差不多,但是通过我们不断优化数据库,最后把之前一天要跑13个小时的应用,到达梦跑不到一半时间,5个多小时就处理完。就这样,达梦OLAP数据库由备用系统一步一步走向主用,最后把国外系统下线了;接着又把另外一套大数据系统业务也合并到这套达梦的分布式数据库之上,将另外一套国外系统也下线了。
这套系统相对还算稳定,但经常出现头接尾,出现数据丢失情况。原国外系统中TOP10应用平均应用时长大概是1.18小时,而用达梦的系统,同时换了另外不同国外系统之后,TOP10应用平均应用时长只有0.65小时,达梦只用了原来国外数据库的一半时长。再一个就是,因为我们用的OLAP系统,我们跟达梦在降低空间存储方面还实践了很多有效的办法。
当然中间的过程是非常艰辛的,达梦研发团队付出了极大的努力,改进速度和迭代效率不断提高。
对数据库应用来讲,存在时间、空间的考验。可能没有做过大数据的都没有感觉到,数据大到存进去的东西取不出来,硬盘都转不起来了,因此时间和空间是一个永恒的矛盾。在这个上面我们移动团队也从业务和架构方面做了非常大的改进。
我曾经跟达梦高管团队沟通,希望有一天,达梦的一套OLAP系统能同时替换原来两套国外数据库(已经非常艰难的),最后事实是我们已经做到了。
传统做数据库的厂家,他们在网管上,更多把注意力放在资源利用率监控、数据本身运行监控等等。项目中,我们告诉他怎么做可能更适合,以我们多年经验来讲,从业务层面开始进行监控。所以我们把底层监控和应用监控加在一起,使得达梦数据库的稳定性又得到比较大的提升。其实,在监控领域,是国产数据库赶超国外数据库的一个比较好的途径,对业务理解上的补充这是非常重要的。
今年到这个月底,我们已经做了百分之八十以上的应用层改造,已经基本完成。我们原来应用层用28台国外单机关系数据库,现在我们只用7个节点的达梦新一代分布式数据库一套就是先全替换,采用云化部署,稳定性提高的同时,资源都大大省了下来。
总结与思考
最后是我们的总结,我想这是我们用心工作以后的真实的想法。
第一,自主研发的重要性。因为福建移动做的这套主动运维系统是百分之百我们自己做的。如果这个系统别人做的,迁移可能会存在一些问题。因为是我们自己做,我们对业务深刻理解,所以使后续处理问题变得简单了。
第二,长期的暴力应用场景对达梦来讲是一个考验。长期暴力测试,所有原来没出现的问题它都会暴露出来,最后都能解决,证明达梦数据库更稳定了。
第三,可管可控是提升国产数据库有效途径。前面我说的底层的网管能力、应用层的网管能力都是对你的能力有效的一个提升。
第四,兼容性是国产数据库必过的一个坎。达梦跟Oracle的兼容性做的很好。我们国产数据库是后来者,为了降低应用层迁移的成本,在兼容性方面一定要做好。
最后,期待未来和达梦有更多更深入、更全面的合作,双方携手推进国产数据库在运营商行业更好的应用。