与传统的视频生成模型只输出一个完成的视频片段不同,世界模型的目标是生成 可探索、可修改、可控制的完整环境。用户或软件代理可以在其中移动、操作对象甚至改变场景。
视频数据则不同。它记录的是现实事件随时间展开的过程,因此可以直接展示物理规律。通过视频训练,模型可能学到:
在这种思路下,视频生成技术不仅是创意工具,也成为训练AI理解现实的关键数据来源。
目前Runway的主要收入仍来自创意行业,但公司长期愿景远不止媒体制作。成熟的世界模型理论上可以支持多种领域,例如:
训练世界模型需要极其庞大的计算资源。为此,Runway在2026年完成 3.15亿美元E轮融资,估值约53亿美元,投资方包括General Atlantic、Nvidia、Adobe Ventures和AMD Ventures等。
Runway并不是唯一押注这一方向的公司。越来越多AI实验室正在尝试构建能理解环境的模型,而不仅仅是语言系统。
潜在竞争者包括:
即便AI视频生成能力快速进步,一个关键问题仍然存在:
生成逼真的视频,是否真的意味着模型理解了物理规律?
许多研究人员认为,当前的视频模型可能只是学习了视觉模式,而不是掌握真实的因果物理规则。因此,它们能生成看起来合理的画面,但未必能可靠预测现实世界的行为。
这也让Runway的战略成为一场典型的高风险高回报赌注。
如果世界模型真的成为未来AI理解物理世界的核心基础设施,那么Runway在视频领域的先发优势可能非常关键;但如果视频模型最终仍主要停留在创意生成工具层面,拥有更强算力和资源的大型科技公司可能会占据主导地位。
Comments
0 comments