抹黑自主技术无助于解决卡脖子问题

随着信创事业的推进,国产CPU、GPU、OS、数据库等基础软硬件迎来发展机遇期,在一批坐冷板凳几十年的企业获得政策红利的同时,一批大公司也以技术引进的方式开发基础软硬件,试图抓住政策红利。这直接导致了国产CPU、GPU、数据库均呈现出鱼龙混杂的情况。由于一些大公司有很强的营销能力,以及一些媒体不负责任的报道和券商胡乱引用,在舆论方面造成了混乱。铁流认为,那些几十年磨一剑自主研发的老牌数据库厂商不应蒙受不白之冤,应还以清誉。基于开源数据库二次开发的国产数据库则不宜过度吹捧。

500

国产数据库的三条技术路线

目前,国产数据库厂商有几十家,仅入围国家机关2021年数据库软件协议供货采购项目厂商就有三十余家。之所以有这么多家数据库厂商,主要还是因为基于PostgreSQL、MySQL等开源数据库可以开发出堪用的国产数据库,这一点和早些年几十家国产操作系统厂商有点类似——国内公司哪怕只有几十人规模也可以基于ubuntu、Debian、fedora等Linux发行版二次开发一个国产操作系统。虽然国内数据库厂商数量众多,但真正掌握核心技术,具备脱离国外技术自我技术迭代的国产数据库厂商屈指可数。

目前,国产数据库已经形成了三条技术路线:

第一条路线是从零开始自主研发,代表厂商为达梦;

第二条路线是基于PostgreSQL、MySQL等开源数据库二次开发,诸多大公司采用该技术路线;

第三条技术路线是直接买外商的授权,然后将其包装为国产数据库,最典型的例子就是某公司从IBM购买Informix数据库,然后摇身一变成为自主研发数据库。

不知是否因为一些大公司在公关宣传和舆论引导方面预算非常充足,在不少报道中,基于国外开源数据库搞二次开发的技术路线被捧的很高,自主技术路线则直接被无视,甚至在一些报道中将自主技术路线贬低为“抄袭”——一些媒体声称达梦的源码是从甲骨文购买,或反编译甲骨文数据库。只要对国内数据库历史有一定了解的人都知道,这些报道完全是子虚乌有。达梦的数据库是冯裕才团队用40余年时间从零开始自主研发数据库,是不走捷径的“笨方法”,在当下购买国外授权和引进开源代码,“走捷径”大行其道的背景下是极为罕见的。

将自主技术贬低为“抄袭”的舆论之所以会被一些人流传和接受,一方面说明了达梦的数据库确实不错,已经能够在部分领域对甲骨文实现替换;另一方面说明一部分国人不自信,不相信从零开始自主研发能够做出可以媲美国外寡头的产品,但凡自主技术性能好一点,就习惯去认个“洋爹”,潜意识中认为“中国人自己做不了这么好,只有洋人才行”,根源还是缺乏精神之钙。

开源软件可以利用但不能依赖

当下,在一些媒体报道中,基于PostgreSQL、MySQL等开源数据库二次开发的做法被捧为“阳光大道”,自主研发路线则被无视,甚至被否定。一些厂商也对基于PostgreSQL、MySQL二次开发的产品自吹自擂,一些媒体甚至标榜“开源=自主研发”、“开源=完全可控”。铁流认为,这种舆论是值得商榷的。

从自主性和技术自主迭代能力上看,达梦数据库经过40余年的自主研发,其自主性和原创性毋庸置疑,据说国家多个相关部门对达梦数据库的代码进行过黑匣子测试,对达梦数据库的自主率高度认可。40年的发展也已经用实践证明了达梦具备自主迭代能力。相比之下,开源软件则存在始终跟随上游身后跑的问题。由于一些开源数据库代码贡献者中外国程序员占多数,且维护管理方面中国并无太多话语权,国内企业往往是从国外下载源代码,然后结合自己的应用和需求做一些修改,当开源软件更新版本之后,国内企业往往需要同步更新,因而在独立性和自我技术迭代方面是存在一些瑕疵的。就自主性而言,由于源代码主要是从国外“搬运”回来的,国内做的工作主要是修修改改,因而在自主方面也是存在瑕疵的。因此,这些基于开源软件二次开发的数据库可以称为“国产”,但未必能称为“自主”。

就完全可控的角度看,是否可控与是否开源没有必然联系。众所周知,Win10是微软开发的,虽然对于中国用户而言Win10未必完全可控,但对于美国和微软而言,Win10是高度可控的。事实上,对于Win10微软并没有开源,因为是否可控与是否开源没有必然联系,Win10是否可控,关键在于微软的技术实力,而不是Win10是否开源。用软件开源论证其完全可控是脑残逻辑。

类似的,国内各类高精尖装备上的软件,源代码100%由国内单位完成,属于完全可控,但这些源代码压根不开源,难不成这些尖端装备就不可控了?

必须说明的是,将基于开源软件二次开发的软件开源是理所应当的,个别厂商下载开源代码修修改改然后又开源,并对开源行为自我吹捧是毫无道理的。就自主研发的闭源软件而言,要求其自证“可控”而去开源则是毫无道理的。毕竟开源和可控没有必然联系,何况前者的源代码是从国外“搬运”回来的开源代码,而后者的源代码是一行一行自己写的。

铁流认为,引进开源代码和自主研发并无高下之分,属于各有优劣。自主研发的优点是自主性强、独立性强,走得稳,能够最大程度上锻炼技术团队,发展后劲强,缺点是前期发展会相对慢一些。引进开源代码的优点是起点高,可以高开高打,缺点是独立性、安全性存在瑕疵,自主技术迭代能力上会弱一些。

就目前来说,无论技术引进还是自主研发,只要能够替换甲骨文、微软、IBM等外商的数据库,就是好产品。关键还是要形成自主研发和技术迭代的能力。我们可以“站在巨人肩膀上”利用开源技术,但不能“跟在开源身后吃土”形成技术依赖。

500

抹黑自主技术无助于解决卡脖子问题

过去这些年,抹黑自主研发是舆论的主流,引进国外先进技术被捧得很高。之所以造成这种现象,一方面是国内很多“精英”对西方抱有幻想,整天想着“夫妻论”、“与国际接轨”、“融入国际主流”、“跟在洋人身后吃土”,社会舆论也是弥漫着崇洋媚外的风气,一些商品主要市场明明在中国大陆,偏偏要去欧美开发布会,以“洋人都来点赞”吸引消费者购买。另一方面也许是因为外国公司和本土技术引进企业家大业大,公关营销预算非常充裕。而自主研发的企业基本处于国外寡头和本土买办的夹缝中求生存,要把钱用在刀刃上进行研发,压根没有多少资源可以用在宣传营销上,只能对网络上的谣言和不实报道视而不见,闷头苦干用成绩说话。

在信创事业稳步推进的当下,抹黑自主技术并非孤例,而是普遍现象,特别是在基础软硬件方面尤为明显。最典型的例子就是抹黑作为CPU自主研发领头羊的龙芯。龙芯的CPU核历经20年迭代演进,GS132、GS232、GS464、GS464e、GS464v、GS464x......可谓每一代CPU核迭代路径清晰明了,但依然被攻击。在推出LoongArch自主指令集,并将基础指令开源之后同样被攻击。

500

之所以如此,主要是因为龙芯20年磨一剑自主研发实在是过于苗正根红了,如果不把龙芯“黑”成炭灰,那么其他引进英特尔、ARM技术的厂商就会显得一脸买办相,非常难堪,很难忽悠国家给钱给政策,在信创市场竞争中也会天然处于劣势。类似的道理,如果不把走自主技术路线的达梦否定掉,那么,走技术引进路线的厂商会比较难堪,特别是在把技术引进包装成自主研发向国家要政策要钱的时候,有达梦这样一个苗正根红的参照项,对于向国家要政策的技术引进厂商而言无疑是非常尴尬的。

简言之,当下抹黑自主技术符合个别大公司利益,但无助于中国实现核心技术自主化,解决卡脖子问题。

结语

长远来看,建立国产CPU+OS+数据库的自主生态体系是大势所趋,在CPU方面,龙芯、申威是自主CPU的代表。在数据库方面,达梦则是自主数据库的代表,有鉴于达梦已经占据部委和地方网信市场的50%以上,俨然成为国产数据库的领头羊。

诚然,相对于甲骨文、微软、IBM的数据库,达梦数据库依然存在这样或那样的不足,但这并非无法弥补。90年代,国外产品问题比达梦现在多得多,为什么当年国内用户能容忍甲骨文、微软、IBM的产品能出问题?现在国产的技术水平上来了,而且是全线上,这个是了不起的一件大工程,从全国的试点和应用情况来看,差距并非不可弥补,只要大家把服务做到位,产品做的更加精益求精,眼前的这些问题都可以解决。

站务

全部专栏