Shazeer绝非普通AI高管。他是2017年论文**《Attention Is All You Need》**的共同作者,该论文提出的Transformer架构是当下几乎所有大语言模型(包括GPT、Gemini、Claude)的技术基石 。他还发明或共同发明了多头注意力机制(multi-head attention)和混合专家模型(Mixture of Experts)等关键技术
。
Shazeer于2000年加入谷歌,供职21年后在2021年离开,原因是公司拒绝发布他主导开发的AI聊天机器人项目 。他与同事Daniel De Freitas共同创立了Character.AI,这家初创公司迅速达到10亿美元估值
。
2024年8月,谷歌与Character.AI达成了一项27亿美元的授权协议——结构上被称为“反向收购式招聘”(reverse acqui-hire)——将Shazeer及其研究团队带回谷歌 。他被任命为Gemini项目的联合技术负责人,与Jeff Dean和Oriol Vinyals共同领导
。美国司法部后来还调查了这笔交易是否规避了并购监管
。
时机也颇为微妙:OpenAI据报正在筹备IPO,能吸引到Shazeer这样的AI架构奠基人,无疑会极大增强其技术领导力与市场叙事 。而对谷歌来说,花了几十亿美元“买回”的Gemini联合负责人再次出走,是其在保持前沿模型领先地位的竞赛中一次重大挫折
。
Comments
0 comments