xAI 的 Grok Imagine Video 1.5 结束预览正式上线,Fast 模式下生成 6 秒 720p 视频仅需约 25 秒,相比前代 40 秒以上的耗时近乎提速一倍,并首次引入与画面动作自动匹配的同步音频生成功能 [1][2][10]。 模型大幅增强了运动连贯性和物理真实感,有效改善了肢体扭曲、物体漂浮等常见 AI 视频缺陷,能更准确地模拟衣物摆动与下落物体的加速轨迹,整体观感更接近真实物理世界 [10]。

Create a landscape editorial hero image for this Studio Global article: What new AI video model did Elon Musk's xAI unveil on June 17, 2026, and what key improvements does Grok Imagine Video 1.5 offer over its pr. Article summary: On June 17, 2026, Elon Musk's xAI officially launched **Grok Imagine Video 1.5**, graduating it from preview to general release via the xAI API and the Grok Imagine app [1][2][10]. Here are the key improvements over its . Topic tags: general, general web, user generated. Reference image context from search candidates: Reference image 1: visual subject "# Grok Imagine Video 1.5 Preview: xAI's Most Powerful AI Video Generator Yet. xAI's Grok Imagine Video 1.5 Preview has claimed #1 on the Image-to-Video Arena leaderboard with a +52" source context "Grok Imagine Video 1.5 Preview — xAI's #1 AI Video Generator" Reference image 2: visual subject "Free Shipping in th
2026 年 6 月 17 日,埃隆·马斯克旗下的人工智能公司 xAI 正式发布了 Grok Imagine Video 1.5。这标志着它从破纪录的预览阶段步入了全面开放使用的新阶段 。xAI 称其为“迄今为止最好的图生视频模型”,此前该模型在几周内便迅速登顶 Image-to-Video Arena 排行榜第一的位置,表现令人瞩目
。这次更新并非小修小补,而是直击 AI 视频创作的痛点——速度、真实感与音频集成,力求让技术变得更快、更完整,真正服务于现实的创意工作
。
此次升级最直观的感受是等待时间的大幅缩短。Grok Imagine Video 1.5 新增的“Fast”模式,能在 大约 25 秒 内生成一段 6秒长、分辨率 720p 的视频,其速度相较于上代模型所需的 40 秒以上,近乎提升了一倍 。对需要快速迭代视觉创意的开发者和创作者来说,生成周期的减半将显著加速工作流程,使快速原型设计和灵感试错变得轻松许多
。
在速度之外,Grok Imagine Video 1.5 着力解决了长期困扰 AI 视频模型的画面瑕疵问题。上一代产品常因运动连贯性不足而出现肢体不自然扭曲、物件“漂浮”等明显破绽 。1.5 版本在很大程度上修正了这些行为,呈现出更为流畅自然的人物动作和镜头运动
。
更细致的变化体现在物理模拟能力的升级上。模型现在能够诠释更微妙的重量感和动量,比如能够渲染人物行走时衣摆的自然晃动,或者物体下落时符合现实规律的加速轨迹。这让生成出的视频片段更有物理世界的真实质感,而非仅仅是数字拼贴 。
此番更新战略意义最为重大的,莫过于 内置同步音频生成功能 的导入,这一点是前代产品所完全不具备的 。以往,为 Grok 生成的视频配上声音,需要借助外部工具并手动调整音画同步。如今,1.5 版本能够在生成画面的同时,自动匹配环境音、音效和氛围音,使音频与屏幕上的动作紧密相扣
。这种一体化的生成方式消除了创作流程里的一大摩擦点,让艺术家和内容创作者可以一步到位,直接得到一个完整的视听片段
。
此次发布前,xAI 在 2026 年 6 月 3 日启动了预览期。在此期间,Grok Imagine Video 1.5 迅速在行业基准测试中证明了自己的实力。它在 Artificial Analysis 的 Video Arena 排行榜上强势登顶,ELO 评分相较前代 1.0 模型实现了 +52 分的巨大跃升 。它的成绩一举超越了包括字节跳动 Seedance 2.0 和谷歌 Veo 在内的强劲对手。作为推广,xAI 首席执行官埃隆·马斯克分享了一段由该模型生成的《伊利亚特》AI 预告片,该视频在 X 平台上迅速斩获了超过 1800 万次的观看量
。
需要说明的是,Grok Imagine Video 1.5 与 Grok 聊天机器人虽共享品牌,但它是截然不同的独立产品,专注于将文本和图像转化为视频 。随着预览期结束,该模型现面向开发者全面开放,可通过 xAI API 调用(模型名称为
grok-imagine-video-1.5)。一般用户则可以通过网页、iOS 和安卓端的 Grok Imagine 应用直接使用 。xAI 将同步音频直接融入高速生成的管道中,正以此押注一种“一站式”的创作体验,以定义 AI 视频生成领域下一阶段的竞争格局
。
Studio Global AI
Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.
xAI 的 Grok Imagine Video 1.5 结束预览正式上线,Fast 模式下生成 6 秒 720p 视频仅需约 25 秒,相比前代 40 秒以上的耗时近乎提速一倍,并首次引入与画面动作自动匹配的同步音频生成功能 [1][2][10]。
xAI 的 Grok Imagine Video 1.5 结束预览正式上线,Fast 模式下生成 6 秒 720p 视频仅需约 25 秒,相比前代 40 秒以上的耗时近乎提速一倍,并首次引入与画面动作自动匹配的同步音频生成功能 [1][2][10]。 模型大幅增强了运动连贯性和物理真实感,有效改善了肢体扭曲、物体漂浮等常见 AI 视频缺陷,能更准确地模拟衣物摆动与下落物体的加速轨迹,整体观感更接近真实物理世界 [10]。
该模型此前已在 Image to Video Arena 排行榜登顶,用户现可通过 xAI API 直接调用 grok imagine video 1.5,或通过网页、iOS 及安卓端的 Grok Imagine 应用使用这一图生视频、文生视频功能 [1][2][3]。
Loading comments...
Comments
0 comments