11月9日,2022世界互联网领先科技成果在乌镇揭晓,全球共15个技术项目从近300项优秀成果中脱颖而出,入选此次领先科技成果。其中,蚂蚁集团自主研发的原生分布式关系数据库OceanBase成为数据库领域的唯一入选案例。
这也让原生分布式关系数据库进入了大众视野。作为数字经济时代不可或缺的底层技术支持,数据库的能力也代表着国家的基础技术实力。2021年工信部印发《“十四五”信息化和工业化深度融合发展规划》,明确提出加速分布式数据库、混合事务分析处理数据库、共享内存数据库集群等产品研发和应用推广,从政策层面点明了数据库的发展方向。
数据库为何如此重要?自研分布式数据库为何能够入选代表全球领先技术的世界互联网领先科技成果?这也可以从OceanBase首席科学家的发言中一见端倪。
蚂蚁集团副总裁、OceanBase首席科学家阳振坤在发言中如此介绍数据库的重要性:“作为关键的信息基础设施,关系数据库的安全、稳定、可靠、性能、容量等对国计民生有着根本性的影响。数字经济和数字化转型对关系数据库提出了更高的要求。”
“分解”数据库
分布式数据库的关键点,还是在“分”上。与传统关系型数据库不同,分布式数据库作为新一代数据库形式,将传统“串联”的数据库处理关系转化为“并联”的处理关系。
这是怎样的一个概念?作为传统“串联”的关系型数据库,如果干路上的一个环节出现问题,那么整体的数据库工作将出现宕机等高风险问题。但分布式数据库采用“并联”的处理方式,将各个支路上的处理信息汇总到干路上,单独支路的“堵塞”并不会影响其他支路和干路的工作,同时,可以随时根据工作量的需要来增加支路以保证整体高效处理信息的能力,大幅提升运行效率,分散风险,降低成本。
随着云计算技术的发展,云原生技术也为分布式数据库提供了新的技术助力,在云上基于云研发的原生应用让分布式数据库在即时应用、及时调整、可扩展等方面,都展现了优异的应用优势。
这些特点和优势都解决了传统关系型数据库部署成本高,且在数字经济下无法灵活应对爆发式数据增长的难题。
单从OceanBase来看,在历经三次大版本的迭代与升级后,其已经在功能丰富性、系统安全性、产品易用性上向国际顶尖产品看齐,并具有数据强一致、高可用、高性能、在线扩展、高度兼容SQL标准和主流关系数据库、低成本等特点。
例如,OceanBase首创了数据库系统的无损容灾技术和“三地五中心”城市级故障无损自动容灾方案,实现了在多数派副本正常的情况下保证数据不丢失和服务不中断。同时,OceanBase研发了每秒千万次事务处理能力的分布式事务处理技术,实现了关系数据库的无限水平扩展和分布式事务的强一致性。
今年8月,OceanBase发布最新的4.0版本。据OceanBase首席执行官杨冰介绍,OceanBase 4.0已经可以运行在如名片般大小的电脑树莓派开发板上。而且,单机部署同样具备分布式数据库所具备的完整功能,同等硬件条件下,性能超越甲骨文关系型数据库MySQL。
金融行业的技术“基石”
分布式数据库的技术能力在金融场景应用中的价值体现更加明显。
作为国家经济主动脉的金融行业,因为其特殊的重要性对底层技术的稳定性要求极高,容错率极低,一点点不稳定因素都将给国家经济带来不可估量的影响。这也是金融行业在选择技术解决方案时极其严苛、谨慎的原因。
随着中国数字经济的快速发展,金融行业的数字化转型也在加快推进。从政策层面来看,今年1月中国银保监会印发了《关于银行业保险业数字化转型的指导意见》(以下简称《指导意见》),明确指出以数字化转型推动银行业和保险业高质量发展,构建适应现代经济发展的数字金融新格局,不断提高金融服务实体经济的能力和水平,有效防范化解金融风险。同时,要从健全数据治理体系、增强数据管理能力、加强数据质量控制、提高数据应用能力等四个方面提升数据治理与应用能力。
这其中,起到关键技术支撑作用的便是数据库。
从业务层面来看,随着数字化转型的加快,金融行业数字业务的不断增多,金融行业面对越来越多的数据处理需求,保证数据安全、应对数据增长压力、对数据进行及时分析和风控管理,都是金融行业需要从技术层面解决的难题。
而这又将需求直指数据库建设。
由此来看,数据库可以说是金融行业的技术“基石”。而分布式数据库提供给金融行业更好的解决方案。相比传统关系型数据库,分布式数据库的模式拥有与生俱来的容灾能力。其中,OceanBase原生分布式设计之初假定硬件资源是不可靠的,每个模块的设计和实现都考虑主动容灾和故障防御。支持多个数据副本分散存储在不同地域,实现跨地域容灾部署。OceanBase能够支持强一致性事务,数据修改在多个地域保证提交成功,因此当灾难发生时,数据不会丢失,达到国家标准定义和最高级别容灾标准。
同时,OceanBase数据库使用一套系统支撑海量交易和海量分析,基于分布式架构做好交易处理场景的同时,能够完成分析、跑批等分析型场景,真正一套引擎支持OLTP+OLAP工作负载,同时实现两套系统功能,大幅降低企业成本。
值得关注的是,OceanBase还打破了分布式数据库的技术限制,推出首个单机分布式一体化架构,可像单机数据库一样使用。这意味着,单机部署不损失数据库性能,在需要分布式部署时,也能实现多机性能自动扩展,无论是高频的交易业务,还是批量数据处理,均能很好支持。这对于金融行业来说,无论是稳定性、技术性、处理数据能效、成本等方面,都得到了最大的优化和支持。
中国数据库“分布式”突围
数字经济和数字化转型对关系数据库提出了更高的要求。过去,数据库领域几乎由国外企业占据主导地位。从上世纪80年代数据库兴起,甲骨文、微软、IBM等企业便一直占据优势地位,难以撼动。
这一情况在2010年左右出现了改变。移动互联网的兴起让中国抓住了发展机遇,互联网应用繁荣发展,倒逼了数据库等底层技术的研发创新,分布式数据库模式应运而生。在十年多的时间里,国内便涌现了一批极具竞争力的数据库产品,其中就包括OceanBase。
传统金融行业要解决数字化转型的关键问题,只能从基础技术构架上入手,更高容错率、更快相应速度、更便捷开放流程等都在重塑全球金融行业技术秩序和发展模式。对于中国来说,跟上这一技术变革,将抓住发展机遇,助推经济发展,增强国家实力。
目前,中国技术力量在全球评比中也得以体现。根据全球权威 IT 咨询机构 Forrester 发布的 2022 年度 Translytical 数据平台厂商选型报告显示,国内自主研发的原生分布式数据库 OceanBase 成功入选。该报告针对数据库技术给业务和客户所带来的影响提供务实和具有前瞻性的建议,是业界公认的极具价值的权威报告。除 OceanBase 以外,甲骨文、IBM、微软等数据库厂商都位列其中,这也是中国厂商首次入选该报告。
在应用落地方面,中国自研分布式数据库已经融入了中国金融系统,包括工商银行、苏州银行、招商证券、中国人民保险、中华保险等企业,都采用了我国自研分布式数据库系统。
而面对丰富的应用场景和复杂的技术需求,分布式数据库的应用也从金融行业向通信、能源、政务等多个领域拓展。
这也让国家层面的政策推进有了技术支撑。中国人民银行印发《金融科技发展规划(2022-2025年)》(以下简称《规划》)。《规划》指出,要布局先进高效的算力体系,深化关键核心技术应用,稳妥推进信息系统向多节点并行运行、数据分布存储、动态负载均衡的分布式架构转型,为金融业务提供跨地域数据中心资源高效管理、弹性供给、云网联动、多地多活部署能力,实现敏态与稳态双模并存,分布式与集中式互相融合。
跳出行业场景,从市场规模来看,中国的数据库市场规模非常庞大,中国需要自己的数据库自研力量。根据中国信通院测算,2020 年全球数据库市场规模671亿美元,其中中国数据库市场占全球 5.2%,约35亿美 元。预计到 2025年,全球数据库市场规模将达到798亿美元。中国 IT 总支出在全球占比为12.3%。而2025年中国数据库市场预计在全球的占比接近中国IT支出在全球的占比,因此2025年中国数据库市场总规模将达到 688亿元,年复合增长率(CAGR)23.4%。
值得关注的是,我国自研数据库的市场占有率也在不断扩大。根据 IDC 数据,2021年下半年国内数据库厂商在关系型数据库市场的市占率继续扩大。其中公有云模式市场前五有三家国内厂商,两家海外厂商份额均下降,腾讯、华为市场份额都扩大。在本地部署模式市场,国内厂商也正在快速追赶甲骨文、IBM等海外厂商。
政策支持、应用需求、企业研发投入增加,都让我国的分布式数据库得到了快速发展。而自研分布式数据库在解决数字经济发展的底层技术支撑问题的同时,也让中国的技术企业与全球巨头站在了同一起跑线上,有了一较高下的机会,而这些企业的不断强大也正在加强我国最底层科技竞争实力。