현재 대부분의 AI 시스템—특히 대형 언어 모델—은 인터넷 텍스트를 중심으로 학습된다.
Runway 공동 창업자들은 여기서 중요한 한계를 지적한다. 텍스트는 사람이 세계를 설명하는 방식을 학습하게 하지만, 세계가 실제로 어떻게 작동하는지를 직접적으로 보여주지는 않는다는 것이다.
반면 영상 데이터는 시간에 따라 변화하는 현실을 그대로 기록한다. 회사는 이런 데이터로 학습하면 모델이 다음과 같은 패턴을 배울 수 있다고 주장한다.
영상은 사건이 시간 속에서 실제로 전개되는 과정을 보여주기 때문에, 단순한 설명이 아니라 물리적 역학에 대한 직접적인 단서를 제공한다. Runway는 이러한 관찰 기반 데이터가 현실 세계를 이해하는 AI를 만드는 데 핵심이 될 수 있다고 보고 있다.
현재 Runway의 제품은 영화 제작자와 콘텐츠 크리에이터가 주요 고객이다. 하지만 회사가 그리는 장기 그림은 훨씬 넓다.
성숙한 월드 모델이 등장하면 다음과 같은 분야에서 활용될 가능성이 거론된다.
흥미롭게도 영화 제작 환경 자체가 이런 연구에 좋은 실험장이 된다. 영상 제작에는 장면 구성, 캐릭터 움직임, 카메라 이동, 공간 연출 등 공간·시간적 역학 요소가 풍부하기 때문이다.
월드 모델 개발에는 막대한 컴퓨팅 자원이 필요하다.
이를 위해 Runway는 2026년 3억1500만 달러 규모의 시리즈 E 투자를 유치하며 기업 가치를 약 53억 달러로 평가받았다. 투자자에는 General Atlantic, Nvidia, Adobe Ventures, AMD Ventures 등이 포함됐다.
물리 세계를 이해하는 AI를 만들려는 시도는 Runway만의 아이디어가 아니다.
현재 여러 대형 AI 연구 조직과 스타트업이 같은 방향을 탐색하고 있다. 대표적으로 다음과 같은 경쟁자가 있다.
AI 영상 생성 기술이 빠르게 발전하고 있지만, 연구자들 사이에서는 중요한 의문이 남아 있다.
“현실적인 영상을 생성할 수 있다는 것이 곧 물리 법칙을 이해한다는 뜻일까?”
시각적으로 그럴듯한 장면을 만드는 것과 실제 세계의 역학을 정확하게 예측하는 것은 전혀 다른 문제다. 현재의 영상 모델이 진짜 물리적 인과관계를 배우는지, 아니면 단순히 학습 데이터의 패턴을 재현하는 것인지에 대한 논쟁은 계속되고 있다.
그래서 Runway의 전략은 고위험·고보상(high‑risk, high‑reward) 성격을 갖는다.
만약 월드 모델이 미래 AI의 핵심 기반이 된다면, 영상 중심 접근을 택한 Runway는 전략적으로 큰 이점을 얻을 수 있다. 하지만 영상 모델이 주로 창작 도구 수준에 머문다면, 더 많은 컴퓨팅 자원을 가진 거대 기업들이 결국 시장을 장악할 가능성도 있다.
현재 Runway는 창작 AI와 현실 시뮬레이션 기술의 교차점에 자신을 위치시키고 있다. 그리고 인공지능의 다음 단계는 텍스트가 아니라 **‘세상을 관찰하며 배우는 AI’**에서 나올 수 있다고 주장한다.
Comments
0 comments