答え公開済み2 か月前Last edited 先月23 ソース

Qwen3.7‑Max：アリババが打ち出した「AIエージェント時代」の主力モデル

Qwen3.7‑Maxは、コーディングや業務自動化などの長時間タスクを自律実行するAIエージェント向けモデルとして発表された。内部実験では、35時間にわたり1,000回以上のツール呼び出しを伴うカーネル最適化を自律的に実行したと報告されている。

Studio Global AIで検索して事実確認さらにトレンドページを見る

Concept illustration of Alibaba’s Qwen3.7‑Max AI model executing autonomous agent tasks — What is Alibaba’s new Qwen3.7‑Max AI model, and what are its key capabilities, benchmarks, and real‑world applications—including its agenticQwen3.7‑Max is designed as a foundation model for AI agents capable of performing long‑running, multi‑step tasks.
AI プロンプト
Create a landscape editorial hero image for this Studio Global article: What is Alibaba’s new Qwen3.7‑Max AI model, and what are its key capabilities, benchmarks, and real‑world applications—including its agentic. Article summary: Alibaba’s Qwen3.7-Max is a new flagship Qwen large language model positioned less as a chatbot and more as an “agent-era” model: it is built for coding, tool use, reasoning, office automation, and long-running autonomous. Topic tags: general, news, general web, user generated. Reference image context from search candidates: Reference image 1: visual subject "# Alibaba launches Qwen3-Max, its largest and most capable AI model to date. **Alibaba has released Qwen3-Max, the biggest and most capable AI model in its lineup. The new model is" source context "Alibaba launches Qwen3-Max, its largest and most capable AI ..." Reference image 2: visual subject "# Alibaba
openai.com

人工知能モデルはこれまで「質問に答えるチャットAI」として発展してきました。しかし最近は、実際の作業を自律的に実行するAIへと進化しつつあります。アリババが発表した最新モデル Qwen3.7‑Max は、その流れを象徴する存在です。

2026年のAlibaba Cloud Summitで公開されたこのモデルは、単なる会話AIではなく、AIエージェントの基盤モデルとして設計されています。コード生成やデバッグ、外部ツールの呼び出し、複雑な多段階タスクの実行などを長時間継続できることが特徴です。

Qwen3.7‑Maxとは

Qwen3.7‑Maxは、アリババの大規模言語モデル「Qwen」シリーズの最新フラッグシップです。特に エージェント型AI（Agentic AI） を前提としたワークロード向けに設計されています。

アリババによると、主な特徴は次の通りです。

多段階の問題解決を可能にする高度な推論能力
コーディングやデバッグなどのソフトウェア開発タスク
外部ツールやAPIの利用
数百〜数千ステップに及ぶ長期タスクの実行

つまり、ユーザーの質問に答えるだけでなく、目標を与えるとAIが自分で手順を考え、ツールを使いながら作業を進めることを想定しています。

35時間の自律タスク実験

Qwen3.7‑Maxで最も注目されたデモの一つが、長時間の自律作業能力です。

アリババの報告によると、内部テストではモデルが 35時間にわたりカーネル最適化を自律実行しました。

この実験では、AIが以下のようなサイクルを繰り返しました。

目標を理解
タスクを小さな工程に分解
コードを生成
ツールやテストを実行
結果を分析して改良

その過程で 1,000回以上のツール呼び出しが行われたとされています。

長時間にわたってタスクの目的や進捗を維持することはLLMにとって難しい課題で、多くのモデルは途中で目標を見失ったりループに陥ります。このため、この種の実験は注目されていますが、現時点では主にベンダー側の報告に基づく結果であり、今後の独立検証が待たれます。

ベンチマークと性能

Artificial Analysis Intelligence Index

AIモデルの総合性能を測る指標の一つ「Artificial Analysis Intelligence Index」では、Qwen3.7‑Maxは 約57 のスコアと報告されています。

この数値は世界トップクラスに近い水準で、GPT系やClaude、Geminiなどの最上位モデルと同じ層に位置するとされています。

LM Arenaランキング

ユーザー投票型ベンチマーク LM Arena（旧Chatbot Arena） では、

Eloスコア：約1475
テキスト能力：世界 13位前後

という順位が報告されています。

さらに細かな分野では次のような順位が示されています。

数学推論：約 7位
専門的プロンプト：約 9位
コーディング：約 10位

また、このランキングでは当時の中国製AIモデルとしては最高順位だったと報じられています。

コーディングとAIエージェントへの強み

Qwen3.7‑Maxは特に 開発者向けのコーディングエージェントとしての利用が想定されています。

想定される用途には次のようなものがあります。

複数ファイルにまたがるソフトウェア開発
バグ修正やコード最適化
GPUやカーネルレベルの最適化
自動テストと改善のループ

モデルはコンパイラ、インタプリタ、APIなどのツールと連携し、コードを書き、実行し、結果を分析して改良するサイクルを繰り返すことができます。

この仕組みにより、単発のプロンプトに答えるAIではなく、継続的に作業するAIエージェントとして機能することが期待されています。

長いコンテキストへの対応

Qwenシリーズは、**長いコンテキスト（大量データを一度に扱う能力）**にも重点を置いています。

関連モデルでは数十万〜最大約100万トークン規模のコンテキストがサポートされる例が報告されています。

ただし、Qwen3.7‑Maxの最大コンテキスト長については公式仕様が明確に確認されていないため、よく引用される「100万トークン」は現時点では慎重に扱う必要があります。

想定される実用分野

アリババは、Qwen3.7‑Maxを企業向けAIエージェントの基盤モデルとして位置づけています。

主な用途として挙げられているのは以下の分野です。

ソフトウェア開発

コード生成
デバッグ
大規模コードベース解析
ハードウェア最適化

オフィス業務

文書作成や要約
業務ワークフローの自動化
生産性ツールとの連携

企業オペレーション

データ分析
カスタマーサポート
業務管理プロセス

こうした用途では、AIは単に文章を生成するのではなく、ツールを使いながら複数の工程を実行してタスクを完了させることが求められます。

世界のAI競争の中での位置

中国のAI業界では、Qwen3.7‑Maxは発表時点で最も強力なモデルの一つとされています。LM ArenaではKimi、DeepSeek、GLMなどの中国モデルを上回る結果が報告されています。

一方で、世界全体で見ると、OpenAIやAnthropic、Googleの最先端モデルが依然として一部の指標で上回るケースもあります。

つまりQwen3.7‑Maxは、トップグループに近い位置にはあるが、まだ競争が続いている段階といえます。

AIは「答える」から「働く」へ

Qwen3.7‑Maxが象徴する最大の変化は、AIの役割です。

従来のAI：

質問に答える
テキストや画像を生成する

次世代AI：

タスクを計画する
ソフトウェアツールを操作する
長時間作業を続ける
目標が達成されるまで改善を繰り返す

この意味で、Qwen3.7‑Maxは**「チャットAI」から「自律型AIエージェント」への移行を示す代表例**と言えるでしょう。

35時間の自律作業のようなデモが今後どこまで再現されるかはまだ検証段階ですが、AIの進化の方向性は明確です。

次世代のAIは、単に答えるだけではなく、実際に仕事をする存在へと変わりつつあります。

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

Studio Global AIで検索して事実確認

人々も尋ねます