这项研究在财务上最重大的发现之一,是关于当你并非在本地和云端之间二选一,而是智能地同时使用两者时会发生什么。
这并不是一个未来主义的可能性。该研究表明,混合本地-云端架构已经可行,并且可以显著降低提供AI推理服务的成本。
解读该研究的评论指出,AI的未来可能是“小型、廉价且无利可图”的前沿AI公司模型。 经济激励正转向能够削弱云API定价的本地开源替代方案——这一动态可能重塑OpenAI、Anthropic和xAI等公司的商业模式。
这项研究是更大趋势中的一个数据点。斯坦福HAI发布的2025年AI指数报告发现,一个性能达到GPT-3.5级别的系统的推理成本,在2022年11月至2024年10月期间下降了超过280倍。 在硬件层面,成本以每年30%的速度下降,而能效每年提升40%。
尽管结果令人印象深刻,但需要注意的是其范围。该研究仅测试了单轮查询——即简单的聊天回复和自包含的推理任务。它没有评估本地模型在多轮对话、长上下文推理或复杂的智能体工作流方面的表现,而所有这些领域,云端模型仍然保持着显著优势。
斯坦福的“智能每瓦特”研究提供了强有力的实证证据,表明本地AI已经跨越了一个关键门槛。对于大多数日常查询——创意任务、管理、销售、娱乐——一个笔记本上的小型模型已经足够。 快速的改进步伐表明,这种覆盖范围只会不断扩大。
对于企业而言,其含义是明确的:最具成本效益的AI基础设施越来越趋向于混合模式,将简单查询路由到本地模型,而将云容量保留给最困难的任务。将每个查询都发送给一个巨型云端模型并按token付费的时代,可能正在走向终结。
Comments
0 comments