数据库国产化野心:OB走出蚂蚁
最近的数据库行业热闹非常。一边是国产数据库崛起的声音。《2020网信自主创新调研报告》显示,国产数据库在国内的市场份额提升至8%-10%,在党政、金融、电信等多个关键领域开始规模化应用。在Gartner发布的2020 年度全球数据库魔力象限中,中国数据库首次进入第一象限
最近的数据库行业热闹非常。
一边是国产数据库崛起的声音。《2020网信自主创新调研报告》显示,国产数据库在国内的市场份额提升至8%-10%,在党政、金融、电信等多个关键领域开始规模化应用。在Gartner发布的2020 年度全球数据库魔力象限中,中国数据库首次进入第一象限。
在数据库于金融、电信这些“重”、“大”领域驰骋的同时,一些声音被忽略了——“自建数据库的成本大吗?有没有必要选择自建数据库?”它们来自中国大量的中小企业,对它们来说,这些问题相当迫切,也相当普遍。
9月11日,全球创业者峰会上有人将这两种“声音”聚合到了一起。蚂蚁集团旗下独立的数据库公司北京奥星贝斯(OceanBase)发布了“创计划”,首期全免费为100家中小企业提供数据库升级服务。
在数据库的国产化之路上,中小企业们从不是无关紧要的角色,甚至是重要的推动者,OceanBase明白这个道理。
开放者
9月10日、11日,全球创业者峰会在北京召开。就在这个会议的前两天,北京市召开优化营商环境“十四五”规划新闻发布会,讲述了一系列对中小企业的扶持计划。时间再往前,是扶持“专精特新”中小企业的北交所成立。
在这个意义非凡的大会上,一家刚成立一年名为OceanBase的数据库企业被邀请参加主论坛发言。9月11日,OceanBase(以下简称“OB”)的CEO杨冰发布了一个相当“大胆”的计划,免费帮中小企业提供数据库服务,首期开放100个名额。
在他的计划中,这只是OB创计划的首期,希望通过首期这100个样本总结出一套为中小企业技术服务的模版,从而在接下来二期三期中更好地服务更多的中小企业。
数据库同芯片、操作系统一道,都是相当重要的IT软件,甚至有人说“没有数据库,就没有企业的根本”。但在这个投资人眼中快公司才有价值的年代,对创业者和中小企业来说,底层技术的搭建注定漫长,从0开始难于登天,很多人只能求助于开源或免费数据库。
OB的创计划,针对的就是这些中小企业。除了1T数据量以外,这个计划没有门槛,“只要报了名说是我们的开源客户,希望得到帮助,我们就会派出专业的人员去做架构咨询,去教如何使用,帮助客户上线后也会再提供一些售后保障机制”,杨冰向《一点财经》表示。
其实,早在3个月前,OB还做了一件大事,那就是开源。
今年6月1日,OB采用木兰协议全面开放内核,在Gitee、Github上进行代码托管,同时成立OceanBase开源社区,300万行核心代码向社区开放。以此,OB从闭源软件走向了开源。
在开源、创计划连续两个动作背后,OB正在走出蚂蚁,变得越来越开放。它开放的底气何在?
革命者
“看着同样是车,但其实特斯拉和油车不是一个时代的产物,未来特斯拉可能就没有方向盘了”,9月10日,杨冰在北京新国展附近向《一点财经》如此通俗地解释OB的分布式数据库与其他数据库质的不同。
OB成立得比特斯拉还早,至今已有十一年的时间,但同特斯拉一样,OB生于“不满足”。那时,淘宝还没有腾飞,蚂蚁还在初创,但一些东西正在悄悄萌芽,其中就有2010年成立的OB。
当时的数据库有两个背景:第一,数据库技术本质上受场景驱动,上世纪开始IT行业最先发展起来的美国也最先发展起了数据库,随后几乎垄断了全球数据库行业。第二,随着21世纪以来中国计算机行业的快速发展乃至超越,中国有了革新数据库的行业基础和诉求。
淘宝是做电商的,随着电商业务的推进,曾任淘宝高级研究员的阳振坤发现了一个现象:传统数据库处理的是封闭物理世界的场景,但像淘宝这样的线上商城没有物理边界,无论是数据量、请求量、访问用户都是天南地北不被限制的,因此必须打破并重新设计数据库。
“做这个的初心其实是做一个未来的数据库,阳老师(阳振坤)认为现在的数据库技术很难去适应未来的时代。第二也是有情怀在,总觉得在中国的软件领域也应该有一些比较硬核的自主品牌出现,而数据库是软件当中除操作系统以外最难的。”杨冰如此解释OB的由来。
一开始,他们想基于一个开源数据库去重新设计,但对市面上的数据库摸了一圈之后,发现找不到符合自己要求的,顶层设计不一样,所以开始从0开始设计出OB。它基于Paxos 协议和分布式架构,构建在通用服务器集群上,不依赖特定硬件架构。
重新设计的OB,可能使用感跟传统数据库一样,但内核里已完全不同,杨冰用“scale out”(线性扩展)和“scale up”(增大)两个词汇来描述两者的差异。
传统数据库像一辆燃油车一样,当觉得马力不足的时候可以scale up,装更多的配件,从8缸到12缸,但再怎么多装,都只能在车的容限里。而OB可以scale out实现线性扩展,能力不够了可以加服务器,单个硬件本身的能力没那么强,但整合起来没有天花板。
“我们用分布式数据库通过了传统集中式数据库最严苛的测试标准,甲骨文做到了每秒钟3000万,而我们做到7.07亿,成为唯一在事务处理和数据分析两个领域测试中都刷新世界记录的中国自研数据库。”全球创业者峰会上,杨冰介绍道。
生长土壤的根本性差异,决定了OB的革命性不同。与传统数据库相比,OB能够帮企业降低50%-80%的成本,规模越大,降低效果越明显。