DeepSeek:人工智能的爱迪生时刻,为何诞生于深度求索这家小公司?

admin

DeepSeek 诞生了,或许意味着人工智能的“爱迪生时刻”已然来临。法拉第在 1831 年就已发现电磁感应现象,这为发电机和电动机的出现提供了理论依据。然而,一直到半个世纪之后,爱迪生发明了耐用且便宜的电灯,并建立了能稳定输出电能的珍珠街电站,人类世界才整体进入电气时代。DeepSeek 具有独特的技术方案,这或许意味着人工智能真正拥有了能够走进千家万户的能力,也意味着人工智能真正拥有了能够改变各行各业的能力。

我想在这里探讨的问题是,为何 DeepSeek 没有在投入数百亿元的互联网大厂和“AI 六小虎”中诞生,也没有在承担大量人工智能国家级课题的大学和研究院中诞生,而是诞生在了规模不大、此前在决策者和公众视野中都默默无闻的深度求索这家小公司,尽管前者所掌握的资源远远多于后者。

也许,我们能够从现代科学技术的组织制度里找到一些明确的线索。 也许,我们可以从现代科学技术的组织制度中寻得几条清晰的线索。 也许,我们有希望从现代科学技术的组织制度中找到若干明确的线索。 也许,我们能从现代科学技术的组织制度中找出几条确切的线索。 也许,我们可以从现代科学技术的组织制度中寻觅到几条明晰的线索。

互联网大厂的性质和定位与传统科研机构差异很大,然而它们的组织特点却极为相似,都属于马克思·韦伯笔下的“科层制”组织。这类组织具有两个明显的特点:其一,在组织模式方面,存在明确的权威,有上下层级之分,并且有专业的分工;其二,在工作流程上,有着明确的规则、流程以及绩效考核的方式。

世界顶尖科研机构__顶尖科研领域

科层制组织依靠这两个特点,能够把成千上万人组织起来,从而高效地实现特定目标。古代的水利工程展现了科层制组织的作用,现代的高铁 5G 也体现了其价值,载人航天以及人类基因组计划同样证明了科层制组织拥有巨大的威力和价值。在人工智能领域情况类似:大语言模型起初并非在中国诞生,然而在科层制组织的推动下,中国的机构在大语言模型的开发上取得了令人瞩目的成果。在 DeepSeek 出现之前,全球各类榜单里都可以看到中国大模型的踪迹,像通义千问、豆包、Kimi 以及智谱清言等。

需要注意的是,科层制组织发挥威力有两个前提。其一,目标要清晰;其二,实现路径要明确。也就是说,项目目标是“工程化”的。因为只有目标和路径确定下来,科层制组织才能把目标沿着路径进行拆分和细化,进而落实到组织内部的每一个层级,也才能将目标和路径落实到每一个组织成员的绩效考核中。

同样需要注意的是,科层制组织显然不能用来创造从 0 到 1 的源头创新。源头创新从本质上来说,是无法提前去定义目标的,并且也无法提前去规划路径。庞大的人类基因组计划能够层层分拆,然而这一切是以 Watson 和 Crick 在 1953 年首先理解基因的分子本质为前提的;国产大模型可以不断涌现,但若没有卷积神经网络、Transformer 和 Llama 的铺垫,国产大模型们围绕规模和性价比的激烈竞争就根本无法开始。

科层制组织不但不能主动催生源头创新,实际上还会(有意无意地)对源头创新进行破坏。因为源头创新本质上是难以准确预测的、具有随机性的,甚至可以说是不专注于本职工作的。它的出现需要天马行空般的探索,需要对事物本源有着狂热的追求,需要个性,需要灵光乍现。科层制组织具有层级制度、严格分工和绩效考核。这种层级制度、严格分工和绩效考核做得越严格、越彻底,就越没有源头创新的机会和土壤。因为组织会认定源头创新是无效的、浪费的、破坏性的。

世界顶尖科研机构_顶尖科研领域_

GPT 取得成功之后,OpenAI 公司的成员创作了《为什么伟大不能被计划》。正如书名所表明的,OpenAI 的一系列源头创新,其来源皆为意外、热情、大胆的设想以及勇于试错的结果。

打个比方,科层制组织就如同现代工业。只要目标清晰且明确,路径也清晰明了,它就能通过严谨的分工以及考核制度全力去推进,展现出无坚不摧的力量。然而,要孕育真正的源头创新,却需要传统的农业。当一把种子撒下去后,我们所能做的仅仅是浇水和施肥,然后耐心地等待。

说到这里,让我们重新回到中国科研制度的讨论上来。

从某种程度而言,人们在谈及科研时,常常会提到“兴趣导向”“自由探索”等词汇。然而,全球的现代科研活动实际上都是在科层制组织的领导下开展的。这一点本身并没有什么值得惊奇的。一方面,现代科研活动主要由政府提供支持,而政府的资金来源于老百姓的纳税,所以理所应当有严格的组织模式和工作流程,以应对纳税人和监管者的审查;另一方面,现代科研活动常常需要组织众多科研人员进行长期的团队攻关,在此情况下,明确的分工和绩效管理是不可避免的。

_顶尖科研领域_世界顶尖科研机构

真正的问题是,在这种严密的组织模式必须存在的背景之下,我们有没有为真正的源头创新留出足够的弹性空间呢?

这方面有不少成功案例。谷歌有独特的 20%时间政策,该政策允许员工投入 20%的工作时间进行自由探索,这为他们带来了像 Gmail 和 AdSense 这样重要的创新。贝尔实验室虽是个庞大的传统科研机构,但它允许自由探索的文化孕育了像晶体管这样的伟大发明。

但熟悉国内科研体制的人可能立刻意识到,这种空间即便没有完全消失,也是极为狭窄且零散的。

我们的科研人员在组织模式方面有着极为复杂的分工和层级。院士处于金字塔的顶端,他们基本上完全脱离了研究一线,然而却掌控着大量的研究资源分配权力。刚刚入行的科研人员,则被困在由研究生、博士后、青年教师、教授、四青人才、杰青/长江等高级“帽子”所构成的复杂链条之中。研究人员们往往更关心的是如何获取链条上更高级别的头衔,而相比之下,他们对于到底关注哪些重要的科学和技术问题则没那么关心。

_世界顶尖科研机构_顶尖科研领域

在工作流程方面,复杂且动态的科研活动也被纵横地切割成极为细碎的片段。比如每一笔经费的计划以及实际的报销情况;每一项研究课题的申报过程、开题事宜、年度总结以及结题汇报;科研发现被转化为研究论文的影响因子以及引用次数;教育创新被转化为课时的数量以及教学奖励。研究人员们的时间和精力被大量消耗在满足各种复杂量化的过程性绩效考核指标中,而相比之下,到底怎样去解决一个重要的科学和技术问题却没有得到足够的关注。

公平地说,这样的问题并非仅在中国出现。比如美国,mRNA 疫苗的发明者 Katalin Kariko 长期未能获得经费支持和永久教职,有史以来最为成功的抗癌药物 Keytruda 长期被搁置在大公司的角落。同样公平地讲,我们也必须承认,即便存在着这样或那样的限制,原始创新依然在中华大地上持续诞生。我无需一一例举,关注科技新闻的读者们自然能如数家珍。

我更想追问的是,我们的科研制度能否放松束缚呢?能否让相同的资源投入,更高效地用于原始创新的孕育之中呢?

科研共同体内部,复杂的分工和层级是否真的无法避免呢?每年在科研项目申报和评审的季节,我们能看到大量的资源和精力被投入到那些无谓的混圈子、打招呼、套近乎的行为上。难道取消了帽子,取消了一层层晋级的阶梯,我们就没有能力评估科研人员的工作了吗?当然不是!同行的评价是最能直击本质的。

_世界顶尖科研机构_顶尖科研领域

DeepSeek 诞生之后,OpenAI 的 CEO 公开表明“我们站在了历史的错误一方”;微软和亚马逊的云计算服务迅速进行了部署,并且开放了 DeepSeek 的模型入口——同行的反馈,这是对 DeepSeek 能力的直接认可。难道说,只有基金评审机构给予帽子头衔,好的科技成果才不会被埋没和无视吗?

比如,目标和路径明确之时,“有组织的科研”能够展现出效率和规模的威力。人类基因组计划就是一个很好的例子:基因的分子本质已被揭示,基因测序技术也已成熟,此时组织全世界的科学家以及科研组织集团进行攻关是合理的抉择。

但存在大量重要问题,这些问题的目标无法定义,路径也晦暗不明,比如如何攻克癌症和衰老,如何理解人脑工作原理,怎样用 AI 技术预测复杂生命活动等。对于这些问题,我们是否应该放下对效率和规模的执念,让对它们有巨大热情的科学家们,遵从自己的灵感,去进行有巨大可能失败的探索呢?

总结和几个具体建议: