這項研究在財務面上最重要的發現之一,是關於「不選擇」只用本地或只用雲端,而是「兩者兼用」的智慧做法。
理想路由 (Oracle routing)——一種能將每個查詢完美分配給最小、但足以勝任的模型的理想系統——理論上可將能源消耗降低80.4%,運算量降低77.3%,成本降低73.8%,相較於純雲端部署 。
這並非遙遠的未來。該研究證明了混合本地-雲端架構的可行性,它已能大幅降低AI推理服務的成本。
相關評論指出,AI的未來可能屬於「小型、便宜、無利可圖」的模型,這對前沿AI公司而言是一大警訊 。經濟誘因正轉向能大幅削減雲端API費用的本地開源替代方案——這個動態可能重塑 OpenAI、Anthropic 及 xAI 等公司的商業模式。
這項研究只是宏觀趨勢中的一個數據點。史丹佛 HAI 發布的《2025 AI指數報告》指出,達到 GPT-3.5 等級系統的推理成本,在2022年11月至2024年10月間下降了超過280倍 。在硬體層面,成本每年下降30%,而能源效率每年提升40%
。
儘管結果驚人,但仍需注意其研究範圍。這項研究僅測試了單輪查詢——即簡單的對話回應與獨立的推理任務。它並未評估本地模型在多輪對話、長文本推理或複雜的代理工作流程(Agentic Workflows)上的表現,而這些正是雲端模型目前仍保有顯著優勢的領域 。
史丹佛的「每瓦智慧」研究提供了強而有力的實證,顯示本地AI已經跨越了一個關鍵門檻。對於絕大多數日常查詢——創意工作、管理、銷售、娛樂——一台筆電上的小型模型已綽綽有餘 。快速進步的趨勢表明,這種覆蓋範圍只會持續擴大。
對企業而言,其啟示非常明確:最具成本效益的AI基礎設施,將越來越多地採用混合模式——將簡單查詢導向本地模型,同時保留雲端運算能力來處理最困難的任務。那種將每一個查詢都發送到龐大雲端模型、並按token付費的時代,可能正走向終結。
Comments
0 comments