科技大厂之间又一次打响了千万年薪的人才争夺战。DeepSeek 在一定程度上起到了导火索的作用。
近期,此前有消息称被雷军以千万年薪邀约的 AI 大牛罗福莉,被红星新闻报道已经正式加入小米;字节跳动挖来了曾在谷歌 DeepMind 担任研究副总裁的吴永辉,他深度参与了谷歌 Gemini 系列模型的研发工作;阿里招揽了全球顶尖的 AI 科学家、前 Salesforce 集团副总裁许主洪,让他出任阿里集团副总裁。
字节和阿里挖人的筹码未被披露。就两人的职位而言,“年薪肯定超过千万,不过其中大部分会以股票形式呈现,或许还会涉及一些绩效考核。”服务大厂的猎头公司嘉明的创始人邢泽进行了分析。
DeepSeek 迅速走红并引起广泛关注,它所激活的不仅仅是顶尖人才市场,大模型行业对一般人才的渴求程度也出现了新的变化。
过去一年里,大模型技术的迭代速度放缓了。在这种情况下,行业对人才的争抢已经开始呈现出放缓的迹象。科技大厂更是进入了优中优选的模式。像一般的数据标注工程师、测试工程师等这些大模型相关岗位,已经不再像以前那样抢手了。甚至连预训练算法方面的人才需求程度,也开始出现了下滑的情况。某科技大厂的 HR 李南这样说道。
一份 2024 人才白皮书报告被字母榜获悉,这份报告也佐证了上述转变。前程无忧的数据统计显示,包括大模型在内的高科技行业,其离职率从 2023 年的 17.7%下滑到了 2024 年的 16.1%。离职率下降背后,透视出大模型行业对人才需求度的减弱。
外界曾以为国内大模型行业竞争格局渐渐清晰,开始变成大厂与 AI 创业新贵之间的资本游戏。然而,就在此时,DeepSeek 在过去一个月里展现出了惊人的表现,正着手重新改写这场游戏的规则。
众多大模型厂商再次回到了比拼技术创新和研发实力的基础阶段。行业对一般人才的渴求度也因此被重新激发起来。
阿里是最先释放信号的一家。阿里招揽完许主洪之后,近期其 AI To C 业务开启了一轮大规模人员招聘。此次开放招聘的岗位达到数百个,其中 AI 技术、产品研发岗位占比为 90%。官方信息表明,新聘人员将把重点投入到文本、多模态大模型、AI Agent 等前沿技术与应用的相关工作中。
上述变化使得邢泽再度忙碌起来。2 月份之后,大模型行业的招聘需求呈现出了 2023 年时那样的热闹景象。
一
越是在大模型上落后一步的大厂,越舍得砸钱挖人。
字节在大模型领域落后于百度和阿里。于是,字节成为了国内挖人最为疯狂的科技大厂。张一鸣重新找回了当年创办今日头条时的那种状态,开始以公司头号 HR 的身份出现。据外媒的报道,字节的内部人士称,尽管张一鸣已经卸任了公司 CEO 的职务,但是从 2023 年中期开始,他一直在积极地参与公司的 AI 战略,并且亲自对从竞争对手公司招聘中国 AI 工程师和研究人员的工作进行监督。
此后,光年之外的原技术骨干是田值,谷歌的原 VideoPoet 项目负责人是蒋路,零一万物的原预训练负责人是黄文灏,阿里通义大模型的原技术负责人是周畅,到如今的谷歌 DeepMind 的原研究副总裁是吴永辉,他们相继被字节重金招募。
据晚点 LatePost 消息,黄文灏提出离职,称要去“奔赴 AGI 梦想”,还讲了字节给出的条件。在此情况下,零一万物内部都不好意思采取挽留的动作。
雷军在豪掷千金邀约罗福莉之前,张一鸣曾因给出千万年薪去招揽周畅,这引发了字节和阿里两家公司的一场纷争。2024 年 12 月初,界面新闻有报道称,通义的前员工周畅因违反竞业协议而跳槽到字节,已经遭到阿里的起诉并要求索赔,目前暂时没有新的进展传出。
吴永辉出任了字节 AI 研究部门 Seed 的新负责人,他成为了到目前为止,字节在大模型领域所挖到的级别最高的科学家。
国外一些科技大厂被 OpenAI 打乱了阵脚,它们为了在 AI 领域加快速度,几乎在同一时间都选择了像字节那样砸钱挖人的策略。
去年,微软收购了 AI 初创明星公司 Inflection 的核心资产,金额超过 6 亿美元。谷歌收购了 Character.AI 的核心资产,金额超过 26 亿美元。
微软最为看重的核心资产是创始团队的人才价值,尤其是其创始人。Inflection 创始人穆斯塔法·苏莱曼曾是 DeepMind 联合创始人。谷歌最为看重的核心资产也是创始团队的人才价值,尤其是其创始人。Character.AI 创始人诺姆·沙齐尔曾是谷歌大脑和“Transformer 八子”之一。
外媒爆料称,尤其是沙齐尔回归这件事。谷歌为这笔超过 26 亿美元的交易,特意注明了一个绑定条款。该条款规定沙齐尔同意重返谷歌。
谷歌联合创始人谢尔盖·布林少有发声。他在一次演讲中兴奋地提及,“Noam 已经回来了,这是一件很棒的事情。”
国内外科技大厂都在争夺顶尖人才,这一争夺情况十分激烈,甚至引得世界首富马斯克都连连发出感叹。去年 4 月,马斯克还发文表示,AI 工程师的竞争“是我见过的最疯狂的人才争夺战”。
部分 AI 大牛不愿意被大厂“绑架”,他们趁着风口选择了独立创业。其中最具代表性的人物就是 OpenAI 原联创伊利亚·苏茨克维(Ilya Sutskever)。
去年 5 月伊利亚从 OpenAI 离职,之后确定创业并组建新公司 Safe Superintelligence(简称 SSI)。不到一年时间,在没有任何产品和 PPT 介绍的情况下,近期 SSI 的估值飙升到超 300 亿美元。据外媒爆料,伊利亚正在以投后 300 亿美元的估值,寻求新一轮 10 亿美元的融资。
二
去大厂能拿到千万年薪,下场创业则可收获百亿估值,这一波的 AI 人才都应该感谢大模型所开启的 AI 2.0 时代带来的新机遇。
2016 年,AlphaGo 通过一场围棋大战。它正式开启了 AI 1.0 创业时代的大门。国内的科技大厂纷纷开始组建与 AI 相关的研究院。并且大力招揽人才:百度把陆奇请来全力投入 AI 领域;阿里挖来漆远等人并组建了达摩院;字节也挖来了马维英、李磊等一批在 AI 领域非常优秀的人才。
但好景持续时间不长。随着 AI 1.0 的热潮逐渐退去,那些陷入商业化困境的大厂,纷纷开始采取行动,缩减了 AI 研究院的规模,并且减少了开支。到 2020 年左右的时候,上述这些科学家中的大部分,都相继离开了大厂,重新回到了学界担任教职。
大模型的爆发,则重新引发了科学家从学界回归产业界的新浪潮。
在 GPT 尚未出现的 2020 年之前,月之暗面创始人杨植麟回忆道。当时的 OpenAI 风评不佳,我们圈子里的人在找工作时,一般会考虑像谷歌这样的公司。很多人与伊利亚交流过后,觉得他这个人很疯狂,太自以为是了,他们认为 OpenAI 不是疯子就是骗子。
OpenAI 面临的招人及融资困境,在那个时候也如同一片片乌云笼罩在国内大模型的上空。大模型创业公司 aiXCoder 的创始人李戈向字母榜回忆说:“当时的投资人既不了解相关情况,也不愿意多听关于大模型的介绍,所以路演很快就会遭遇被拒绝的情况。”
GPT出现后,AI技术人才的价值又一次被无限放大。
相关数据印证着这一转变。前程无忧的统计数据表明,像大模型这样的高科技行业,连续两年在调薪幅度方面位居首位,2023 年的调薪幅度是 5.7%,2024 年是 5.2%,并且预计 2025 年的调薪幅度为 5%,该行业仍将保持调薪幅度第一的位置。
这轮大模型创业期间,投资圈达成一个共识,那就是需要找有技术背景的人。恒业资本创始合伙人江一表示,在这之中,清华大学和卡内基·梅隆大学,已然成为大模型人才输出的两个重要地方。
AI 六小虎里,智谱的张鹏毕业于清华;月之暗面的杨植麟毕业于清华;百川智能的王小川毕业于清华;零一万物的李开复毕业于卡内基·梅隆大学。
杨植麟拥有清华和卡内基·梅隆的双身份,他在 2023 年大模型创业领域成为了种子型选手。曹曦是前红杉中国合伙人,他创立了砺思资本(Monolith)。在其他投资机构广泛撒网之际,砺思资本选择将所有赌注都押在杨植麟身上,接连对月之暗面进行了一、二、三轮投资。
AI 六小虎创始人(包含 MiniMax 闫俊杰、阶跃星辰姜大昕),不管出身于哪所高校,他们有一个共同点,那就是都有技术背景。
在过去两年的大模型创业热潮里,只有一个人不遵循技术背景创业会有变数这一情况,这个人就是光年之外的创始人王慧文。然而,非技术出身所带来的代价是,在那些需要投入更多精力去判断技术路线以及进行资源分配决策的时候,王慧文的身体先承受不住了,于是他被迫退出了这场 AGI(通用人工智能)的争夺战。
2023 年 6 月,据腾讯科技报道,王慧文毫无预兆地“疑似抑郁”。这都源于他极为负责。他虽然不懂大模型,但深知大模型的任何一个决策都涉及过亿资金的投入。在决策试错成本极高的情况下,王慧文想要把事情想得更清楚,就不可避免地要投入远超技术人员的精力去补课大模型知识。
三
王慧文退场后的一年时间里,国内大模型领域在技术方面趋缓。于是,该领域陷入了融资难的状况,同时人才流动也降低了。
数据科学家(非数据标注工)和产品应用专家供不应求。负责预训练、后训练和微调等的人才需求明显降低,并且他们的待遇也有所下降。李南对此进行了总结。
李开复进行了转舵行为,这给大模型遇冷的行情又增添了凉意。在 1 月份,零一万物作出了正式调整策略的举动,成为了首家放弃追求 AGI 的大模型厂商。李开复亲手组建起来的预训练人才队伍,被阿里接管了。
大模型似乎开始模仿移动互联网时代,进入到了一种比拼资本的旧模式。然而,DeepSeek 的出圈,成为了打破这一旧模式的新因素,并且重新引发了大模型行业的人才流动。
AI 六小虎想要在大模型领域重获用户青睐,唯一的捷径是学习 DeepSeek 并通过技术创新证明自己;科技大厂想要在大模型领域重获用户青睐,唯一的捷径也是学习 DeepSeek 并通过技术创新证明自己。
为此,除了吴永辉、许主洪等顶尖大佬之外,更多年轻人才开始受到科技大厂新一轮的青睐。
在 DeepSeek 出现之前,只有 OpenAI 有胆量将毫无经验的应届生或者辍学生用于参与大模型的研发,并且还能够成功地将产品上线。在国内 AI 领域的“六小虎”当中,从王小川所领导的百川智能,到姜大昕所创办的阶跃星辰,再到李开复所创立的零一万物,都招揽了一批自己的老部下以及前同事。
梁文锋作为 DeepSeek 的创始人,将人才组织视为自家在 AGI 大战中的重要保障。这并非是闭源行为,也不是单纯地招募行业顶尖牛人。
梁文锋为 DeepSeek 找到的队伍,就像 OpenAI 那样,是由一批应届毕业生(这些毕业生来自更多 TOP 高校)以及一些毕业才几年的年轻人组成的。并且,对于这些人的 GPU 资源调动没有上限。如果有想法,每个人随时都可以调用训练集群的卡,无需经过审批。同时,由于不存在层级和跨部门的限制,只要对方也有兴趣,就可以灵活调用所有人。”梁文锋说道。
大模型热潮爆发之前,GPU 已是业内招揽人才很有诱惑力的条件之一。“深度学习之父”杰弗里·辛顿(Geoffery Hinton),早年在进行 AI 研究时,一直为从何处能获得更多的卡而困扰。辛顿在 2012 年的 ImageNet(一项图像识别竞赛)挑战赛中夺魁,当时他联手了自己的学生伊利亚等人。一夜成名之后,谷歌开出了 GPU 充足供应的条件,最终吸引了辛顿,在众多邀约中,他选择了加盟谷歌。
十年前辛顿加盟谷歌,现在雷军、张一鸣以及马云等,都纷纷以千万年薪的高额待遇招收顶尖技术人才。他们都看中了这些 AI 大牛能带来的人才“滚雪球”效应。在刑泽看来,大厂用行业顶薪招揽人才的这种举动,属于一种雇主品牌宣传。一旦重视人才的印象在行业中传开,对于后期的社招也会提升吸引力。
参考资料:
阿里在加快“抢人”的步伐。他们开放了数百个招聘岗位,其中九成的岗位都与 AI 相关。
Google Fellow 吴永辉博士加入了字节跳动,他承担着 AI 基础研究探索方面的工作。
《只招1%的天才,这家中国公司让硅谷难安》凤凰网科技
《中国大模型的生存之战:面临巨头的围剿,创业之路艰难难熬》晚点 LatePost
《大模型的扑克牌:独家内幕故事》腾讯科技
《月之暗面》的杨植麟复盘了大模型创业的这一年,他表示要向那绵延且未知的雪山前进。腾讯科技对此进行了报道。
《月之暗面的杨植麟:具备创新精神、注重长期发展、秉持第一性原理》 Monolith 砺思资本