動機係一個經典嘅「自製定外購」嘅商業計算題,只係供應鏈嘅傷口逼使它要即刻行動。據報Intel同AMD近期已將伺服器CPU價格大幅調升10%到35%,Intel仲向中國客戶預告交貨期將延遲長達六個月 。對於一間正準備大規模推出AI代理服務嘅公司嚟講,呢啲絕對係不能接受嘅制約。字節跳動嘅自研CPU預計會用喺自家數據中心,支援內部營運以及旗下嘅AI代理開發平台Coze
。而雙架構並行嘅策略,等於買咗個雙保險,畀公司可以慢慢衡量邊款設計,喺效能、成本同地緣政治彈性三方面最切合長遠需要
。
喺2026年5月26日,彭博社報導Qualcomm已經同字節跳動達成協議,會向對方供應數以百萬計、用於AI數據中心嘅客製化特殊應用積體電路 (ASIC) 。呢單唔係單純嘅買賣咁簡單。多份報導釐清咗,呢項合作其實係一個結合咗「採購」同「生產」嘅協議——Qualcomm會幫手將字節跳動內部嘅晶片設計,變成可以量產嘅半導體產品,並透過好似台積電 (TSMC) 咁嘅代工廠去投產
。
呢批ASIC嘅主要用途,就係驅動字節跳動嘅AI代理軟件,當中最出名嘅就係佢嘅「豆包」AI代理 。對Qualcomm而言,呢個合作夥伴關係係重大勝利,代表佢成功由智能手機處理器市場,擴張到AI數據中心範疇;而對字節跳動嚟講,就等於建立咗一條穩定嘅客製化、針對工作負載優化嘅晶片供應管道,同時可以完全符合美國出口合規要求,有報導甚至形容呢種做法係「像素級完美嘅合規設計」
。
支撐住以上種種新動向嘅,仲有一個更早期、更基礎嘅合作關係。字節跳動一直有聯同美國晶片設計巨頭Broadcom同TSMC,共同開發代號「SeedChip」嘅客製化AI GPU。2024年嘅報導指出,字節跳動正同TSMC合作,基於5納米製程去生產兩款AI晶片——一款用於模型訓練,另一款用於推論任務——並預計喺2026年投入量產 。雖然當時消息滿天飛,字節跳動亦曾否認短期內有計劃取代Nvidia
,但隨之而嚟嘅一系列CPU同LPU相關活動,證明咗佢哋呢套自研晶片戰略只係變得更加深入同廣泛。
呢啲晶片策略唔係紙上談兵,而係一個極度進取嘅AI產品路線圖背後嘅基建基石。根據報導,字節跳動2026年嘅AI預算高達約1,600億人民幣(比2025年嘅1,500億再有增長),其中單係撥俾AI處理器嘅支出已經高達850億人民幣 。
驅使呢股龐大開支嘅原動力,就係「推論經濟學」。當類似Coze同「豆包」呢類AI代理產品要擴展到數以億計用戶嘅時候,「生成每個Token嘅成本」就成為咗核心嘅業務指標。如果要大量買入Nvidia嗰啲又貴、供應又緊張嘅GPU,無論喺財務定係戰略上都係極大風險。因此,自行研發LPU式晶片專攻低成本推論,自研CPU去避開x86處理器嘅加價浪潮,以及為AI代理工作量身訂造ASIC晶片,正正就係針對呢啲風險嘅直接撲殺行動。
字節跳動嘅整套策略,最準確嘅理解方式,唔係「取代Nvidia」,而係一種有條不紊嘅「去耦合」過程。喺最尖端嘅模型訓練等領域,邊度仲有Nvidia硬件可用、邊度佢嘅效能難以取代,就繼續用;但同時間,就建立一整套平行嘅自研晶片疊加層,去應付公司未來日益倚重嘅、大規模量產嘅推論工作負載。喺科技碎片化嘅時代,呢個正正係一份謀求「AI運算主權」嘅多路並進藍圖。
Comments
0 comments