研究中一個最有商業價值嘅發現,係當你唔再「二揀一」,而係聰明地同時使用本地同雲端AI時,會發生咩事。
呢啲唔係遙不可及嘅未來科技。研究清楚表明,混合本地-雲端嘅AI架構已經行得通,而且可以大幅降低AI推理嘅成本。
有分析評論就指出,AI未來可能係屬於「細細粒、平價、但賺唔到錢」嘅模型,尤其係對於前沿AI公司嚟講 。經濟誘因正正轉向本地、開源嘅替代方案,呢啲方案可以喺價格上完勝雲端API——呢股動力隨時會重塑OpenAI、Anthropic同xAI呢類公司嘅商業模式。
呢份研究係一個更大趨勢入面嘅重要訊號。Stanford HAI嘅《2025 AI指數報告》就指出,一個表現達到GPT-3.5水平嘅系統,其推理成本喺2022年11月至2024年10月期間,暴跌超過280倍 。硬件層面,成本每年下降30%,能源效率每年提升40%
。
雖然結果令人眼前一亮,但都要留意研究嘅範圍。呢項研究只係測試咗單輪查詢——即係簡單嘅對話回覆同一次性推理。佢哋冇測試本地模型喺多輪對話、長篇上下文推理,或者複雜嘅自主代理工作流程上嘅表現,而呢啲正正係雲端模型仍然有顯著優勢嘅領域 。
另外,佢哋測試嘅本地模型(參數量≤200億)喺最難嘅問題上,仍然冇辦法同最頂尖嘅雲端模型匹敵。研究人員對此講得好清楚:準確度會因範疇而有明顯差異,88.7%呢個數字背後,隱藏咗技術同科學領域上較弱嘅表現 。
Stanford呢份「智能每瓦特」研究提供咗強而有力嘅實證,顯示本地AI已經跨越咗一個關鍵門檻。對於絕大部分日常查詢——創意寫作、管理、銷售、娛樂——一部手提電腦上面嘅小型模型已經足夠有餘 。以咁快嘅進步速度,本地AI嘅覆蓋範圍只會繼續擴張。
對企業嚟講,訊息好清晰:最符合成本效益嘅AI基建,將會係一個混合模式——將簡單查詢分流俾本地模型,雲端留俾最難嘅任務。每個查詢都要按用量畀錢、送去巨型雲端模型處理嘅時代,可能已經踏入尾聲。
Comments
0 comments