On peut donc affirmer trois choses :
grok-imagine-video, présenté dans un contexte de génération vidéo.Autrement dit, la preuve officielle va jusqu’à : « xAI peut générer une vidéo ». Elle ne va pas jusqu’à : « Grok 4.3 peut comprendre une vidéo que vous lui donnez ».
Plusieurs sources non officielles vont plus loin. Un article affirme que Grok peut générer des vidéos et les analyser ou les regarder. Une autre page de veille indique que Grok 4.3 Beta aurait ajouté des API vidéo, slides et speech.
Un article Substack parle même de compréhension vidéo native et d’entrée vidéo pour Grok 4.3 Beta.
Des résultats de recherche sur X mentionnent aussi l’analyse de vidéos.
Ces éléments peuvent servir de signaux à surveiller, mais ils ne constituent pas une confirmation produit au sens strict. Pour une fonctionnalité aussi concrète que l’analyse de vidéos, on attendrait normalement des éléments officiels : modèles compatibles, formats acceptés, limites de durée, taille maximale des fichiers, méthode d’envoi, disponibilité, prix et limites de débit. Ces précisions ne figurent pas dans la documentation xAI fournie sur la génération vidéo.
La distinction est essentielle.
La génération vidéo consiste à produire une nouvelle vidéo à partir d’un prompt. C’est exactement ce que documente xAI avec le point d’accès videos/generations et le modèle grok-imagine-video.
La compréhension vidéo, elle, suppose l’inverse : l’utilisateur fournit une vidéo, puis le modèle doit identifier des objets, des personnes, des actions, une chronologie et des événements, avant de répondre à des questions. Pour confirmer cette capacité, il faudrait voir une documentation officielle mentionnant explicitement une entrée vidéo, par exemple via un fichier téléversé, une URL ou un format multimodal. Les sources fournies ne montrent pas cela côté documentation xAI.
Le mot « vidéo » peut donc recouvrir deux réalités très différentes : la vidéo comme sortie du modèle, ou la vidéo comme entrée à analyser.
Pour considérer Grok 4.3 comme officiellement compatible avec l’analyse de vidéos, il faudrait idéalement une annonce ou une documentation xAI indiquant clairement :
video inputgrok-imagine-video, qui est présenté dans un flux de génération vidéo ;Si la question est : « Grok 4.3 peut-il aujourd’hui regarder une vidéo courte et expliquer ce qui s’y passe ? », la réponse factuelle, au vu des sources fournies, est : ce n’est pas confirmé de manière fiable.
Ce qui est confirmé, c’est l’existence d’un flux officiel de génération vidéo dans la documentation xAI, avec /v1/videos/generations et grok-imagine-video. Ce qui reste à prouver, c’est la capacité de Grok 4.3 à recevoir une vidéo en entrée et à l’analyser. Les affirmations disponibles à ce sujet viennent surtout de sources tierces ou de contenus sociaux, pas d’une spécification officielle xAI équivalente.
Comments
0 comments