那一年,他共同发表了具有划时代意义的论文《Attention Is All You Need》,正式引入了Transformer架构 。这篇论文至今已被引用超过25万次,被誉为21世纪最具影响力的计算机科学文献之一
。沙泽尔本人亲自设计了其中的多头注意力机制、残差架构,并编写了首个性能超越此前最先进水平的实现代码
。
除了Transformer,沙泽尔还是稀疏门控的混合专家模型(MoE)的先驱,并对Mesh-TensorFlow、T5和Switch Transformer等关键技术做出了核心贡献 。他还领导开发了谷歌的对话AI系统LaMDA,这是今天各类聊天机器人的先驱
。2023年,《时代》杂志将他评为全球AI领域最具影响力的100人之一
。
2021年,在为谷歌效力了大约二十年后,沙泽尔和同事丹尼尔·德·弗雷塔斯(Daniel De Freitas)带着沮丧离开了公司。他们曾开发出一款名为Meena的聊天机器人,但谷歌的领导层出于对安全和产品风险的顾虑,拒绝将其公开发布 。这个决定后来被证明是致命的:第二年,OpenAI发布了ChatGPT,引爆了生成式AI的热潮
。
2024年8月,谷歌做出了一项震惊业界的举措:它与Character.AI达成了一项价值约27亿美元的授权协议 。官方理由是获得Character.AI大语言模型技术的非独家授权
。但据广泛报道并在谷歌内部得到公认的非官方理由,是将诺姆·沙泽尔及其核心研究团队重新招入麾下
。
沙泽尔以谷歌DeepMind工程副总裁的身份回归,并被任命为Gemini的技术联合负责人,与杰夫·迪恩(Jeff Dean)和奥里奥尔·维尼亚尔斯(Oriol Vinyals)并肩作战 。他的领英(LinkedIn)个人资料上,从2024年8月开始的职位描述正是“工程副总裁,Gemini联合负责人 @ Google Deepmind”
。
他的影响力立竿见影。业界报告将沙泽尔视为Gemini缩小与OpenAI的ChatGPT性能差距的关键人物;据称,他在回归后发现并修复了Gemini中的一个深层代码缺陷,显著提升了模型性能 。2026年2月,他的贡献得到正式认可,当选为美国国家工程院院士
。
他离职的具体时间尚未公布 。在宣布这一决定时,他的领英上仍然挂着工程副总裁、Gemini联合负责人的头衔
,而谷歌的官方研究页面也仍将他列为Gemini的“技术联合负责人”
。包括路透社、《海峡时报》和《美国新闻与世界报道》在内的多家权威媒体均已确认这一消息
。
这个时机颇具戏剧性。谷歌在2024年相当于花了27亿美元将他带回来,而不到两年后,仍是私营公司但正迈向IPO的OpenAI就成功将他挖走 。此举淋漓尽致地展现了前沿AI实验室为争夺顶尖研究员所愿意付出的非凡代价,以及顶尖人才在当前市场中拥有的巨大议价权。
尽管失去了一位技术领导力上的关键人物,谷歌的消费级AI产品正处在历史最高点:
诺姆·沙泽尔的人生轨迹,映照了AI产业本身的弧光:从在科技巨头内部进行基础研究,到因挫败而出走创业,到伴随着数十亿美元交易的轰轰烈烈回归,再到现在于对手IPO前夕纵身一跃。很少有个人能如此直接地体现重塑格局的市场力量——无可估量的技术价值、螺旋式上升的薪酬待遇,以及激烈的企业竞争。
谷歌的地位依然强大。但在这个一个研究员就足以左右数十亿美元竞赛天平的行业中,沙泽尔转投OpenAI的举动,明确地传递出一个信号:AI人才的战争,远未结束。
Comments
0 comments