Qwen3.7‑Max: Mô hình AI của Alibaba được thiết kế cho các tác vụ tự động dài hạn
Qwen3.7‑Max là mô hình AI flagship mới của Alibaba, được thiết kế cho các hệ thống agent có thể tự lập kế hoạch và thực thi các tác vụ phức tạp trong thời gian dài. Một thử nghiệm nội bộ cho thấy mô hình có thể tự tối ưu kernel trong 35 giờ với hơn 1.000 lần gọi công cụ, minh họa khả năng làm việc liên tục của AI ag...
What is Alibaba’s new Qwen3.7‑Max AI model, and what are its key capabilities, benchmarks, and real‑world applications—including its agenticQwen3.7‑Max is designed as a foundation model for AI agents capable of performing long‑running, multi‑step tasks.
Prompt AI
Create a landscape editorial hero image for this Studio Global article: What is Alibaba’s new Qwen3.7‑Max AI model, and what are its key capabilities, benchmarks, and real‑world applications—including its agentic. Article summary: Alibaba’s Qwen3.7-Max is a new flagship Qwen large language model positioned less as a chatbot and more as an “agent-era” model: it is built for coding, tool use, reasoning, office automation, and long-running autonomous. Topic tags: general, news, general web, user generated. Reference image context from search candidates: Reference image 1: visual subject "# Alibaba launches Qwen3-Max, its largest and most capable AI model to date. **Alibaba has released Qwen3-Max, the biggest and most capable AI model in its lineup. The new model is" source context "Alibaba launches Qwen3-Max, its largest and most capable AI ..." Reference image 2: visual subject "# Alibaba
openai.com
Trí tuệ nhân tạo đang chuyển sang một giai đoạn mới: AI không chỉ trả lời câu hỏi mà còn tự thực hiện công việc. Mô hình mới nhất của Alibaba, Qwen3.7‑Max, được xây dựng chính xác cho mục tiêu đó.
Ra mắt tại Alibaba Cloud Summit 2026, Qwen3.7‑Max được định vị như nền tảng cho các AI agent có thể lập kế hoạch, viết và sửa lỗi code, gọi công cụ bên ngoài và thực hiện các quy trình nhiều bước kéo dài trong thời gian dài. Thay vì chỉ là chatbot trò chuyện, mô hình này hướng tới việc tự động hoàn thành các nhiệm vụ thực tế trong phát triển phần mềm, văn phòng và doanh nghiệp.
Qwen3.7‑Max là gì?
Qwen3.7‑Max là phiên bản mới trong dòng mô hình ngôn ngữ lớn Qwen của Alibaba, được thiết kế cho các workload dạng agent — nơi AI cần tự phân tích mục tiêu, chia nhỏ công việc và thực hiện nhiều bước liên tiếp.
Alibaba cho biết mô hình tập trung vào một số năng lực cốt lõi:
suy luận nâng cao cho các bài toán nhiều bước
lập trình phần mềm, viết và debug code
gọi công cụ và tích hợp với hệ thống bên ngoài
thực thi các quy trình dài với hàng trăm hoặc hàng nghìn hành động
Xu hướng này phản ánh sự thay đổi của toàn ngành AI: từ hệ thống tạo nội dung sang hệ thống .
Studio Global AI
Search, cite, and publish your own answer
Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.
Câu trả lời ngắn gọn cho "Qwen3.7‑Max: Mô hình AI của Alibaba được thiết kế cho các tác vụ tự động dài hạn" là gì?
Qwen3.7‑Max là mô hình AI flagship mới của Alibaba, được thiết kế cho các hệ thống agent có thể tự lập kế hoạch và thực thi các tác vụ phức tạp trong thời gian dài.
Những điểm chính cần xác nhận đầu tiên là gì?
Qwen3.7‑Max là mô hình AI flagship mới của Alibaba, được thiết kế cho các hệ thống agent có thể tự lập kế hoạch và thực thi các tác vụ phức tạp trong thời gian dài. Một thử nghiệm nội bộ cho thấy mô hình có thể tự tối ưu kernel trong 35 giờ với hơn 1.000 lần gọi công cụ, minh họa khả năng làm việc liên tục của AI agent.
Tôi nên làm gì tiếp theo trong thực tế?
Các benchmark ban đầu như LM Arena và Artificial Analysis cho thấy Qwen3.7‑Max nằm trong nhóm mô hình AI mạnh nhất hiện nay và là mô hình Trung Quốc xếp hạng cao nhất tại thời điểm ra mắt.
Một trong những minh họa đáng chú ý nhất của Qwen3.7‑Max là khả năng duy trì công việc tự động trong nhiều giờ liên tục.
Theo báo cáo của Alibaba và các nguồn tin ban đầu, mô hình đã thực hiện một thử nghiệm tối ưu kernel kéo dài 35 giờ, trong đó nó thực hiện hơn 1.000 lần gọi công cụ để:
viết code
chạy kiểm thử
phân tích kết quả
tiếp tục cải tiến thuật toán
Toàn bộ quá trình lặp lại nhiều lần cho đến khi đạt kết quả tối ưu.
Chu trình agent điển hình của mô hình có dạng:
hiểu mục tiêu
chia mục tiêu thành các nhiệm vụ nhỏ
tạo hành động hoặc viết code
gọi công cụ hoặc chạy kiểm thử
đánh giá kết quả và lặp lại
Việc duy trì logic xuyên suốt hàng nghìn bước là một thách thức lớn đối với các mô hình ngôn ngữ, vì chúng dễ mất mục tiêu hoặc rơi vào vòng lặp. Do đó những thử nghiệm như vậy được xem là bước tiến đáng chú ý — dù vẫn cần xác nhận độc lập ngoài các báo cáo của nhà phát triển.
Benchmark và vị trí trên bảng xếp hạng
Các dữ liệu benchmark ban đầu cho thấy Qwen3.7‑Max nằm trong nhóm mô hình AI mạnh nhất hiện nay.
Artificial Analysis Intelligence Index
Theo Artificial Analysis, Qwen3.7‑Max đạt khoảng 57 điểm trên Intelligence Index — một thước đo tổng hợp từ nhiều bài đánh giá AI khó.
Điểm số này đưa mô hình vào nhóm đầu của các hệ thống AI hiện đại, dù một số mô hình hàng đầu từ các phòng thí nghiệm Mỹ vẫn đạt điểm cao hơn trên cùng bảng xếp hạng.
Xếp hạng LM Arena
Trên bảng xếp hạng LM Arena (trước đây là Chatbot Arena), phiên bản Qwen3.7‑Max‑Preview đạt Elo khoảng 1.475 và xếp khoảng hạng 13 toàn cầu về khả năng xử lý văn bản.
Một số thứ hạng chi tiết gồm:
khoảng #7 về suy luận toán học
khoảng #9 cho các câu hỏi chuyên môn
khoảng #10 cho nhiệm vụ lập trình
Kết quả này cũng khiến Qwen3.7‑Max trở thành mô hình AI Trung Quốc có thứ hạng cao nhất trên bảng Arena tại thời điểm ra mắt.
Điểm mạnh trong lập trình và agent workflow
Qwen3.7‑Max được thiết kế đặc biệt cho AI coding agents — các hệ thống có thể tham gia trực tiếp vào quy trình phát triển phần mềm.
Các khả năng nổi bật bao gồm:
phát triển phần mềm nhiều file
debug và tối ưu code
tối ưu GPU hoặc kernel
chạy vòng lặp kiểm thử tự động
Mô hình được thiết kế để hoạt động cùng các công cụ như compiler, interpreter, API hoặc môi trường phát triển, cho phép nó viết – chạy – phân tích – sửa code liên tục cho đến khi đạt mục tiêu mong muốn.
Context window lớn và hướng đi “long context”
Dòng Qwen gần đây đặc biệt chú trọng context window dài, giúp mô hình xử lý tài liệu lớn, codebase hoặc dataset trong một lần nhập liệu.
Một số tài liệu kỹ thuật của các mô hình Qwen cho thấy context window có thể đạt hàng trăm nghìn đến khoảng một triệu token, tùy phiên bản.
Tuy nhiên, thông số chính xác của Qwen3.7‑Max chưa được xác nhận rõ ràng trong tài liệu công khai, vì vậy các tuyên bố về 1 triệu token nên được xem là khả năng của dòng sản phẩm chứ chưa phải thông số chắc chắn cho riêng mô hình này.
Ứng dụng thực tế
Alibaba định vị Qwen3.7‑Max như một mô hình hạ tầng cho các agent AI doanh nghiệp.
Phát triển phần mềm
tạo code tự động
sửa lỗi và refactor
phân tích codebase lớn
tối ưu phần cứng hoặc kernel
Tự động hóa công việc văn phòng
chỉnh sửa và tóm tắt tài liệu
workflow nhiều bước trong phần mềm văn phòng
tự động hóa quy trình kinh doanh
Hoạt động doanh nghiệp
phân tích dữ liệu
tự động hóa dịch vụ khách hàng
quản lý quy trình vận hành
Trong các kịch bản này, AI không chỉ tạo văn bản mà còn lập kế hoạch, gọi công cụ và thực hiện chuỗi hành động để hoàn thành mục tiêu.
Vị trí trong cuộc đua AI toàn cầu
Trong hệ sinh thái AI Trung Quốc, Qwen3.7‑Max được xem là một trong những mô hình mạnh nhất khi ra mắt, vượt qua nhiều đối thủ nội địa trong các bảng benchmark.
Tuy nhiên trên quy mô toàn cầu, bức tranh phức tạp hơn. Qwen3.7‑Max vẫn đứng sau một số mô hình hàng đầu của các phòng thí nghiệm Mỹ trong các bảng xếp hạng tổng hợp.
Điều này phản ánh cuộc cạnh tranh AI ngày càng gay gắt giữa các công ty công nghệ toàn cầu — nơi các mô hình được so sánh trên nhiều yếu tố như:
khả năng suy luận
năng lực lập trình
chi phí vận hành
khả năng làm việc như agent
Xu hướng lớn: từ chatbot sang AI agent
Điều quan trọng nhất của Qwen3.7‑Max không chỉ là điểm benchmark.
Nó đại diện cho một thay đổi lớn trong cách xây dựng AI. Thay vì chỉ phản hồi câu hỏi, các mô hình mới được thiết kế để:
lập kế hoạch nhiệm vụ nhiều bước
tương tác với phần mềm và công cụ
thực hiện hành động trong thời gian dài
tự lặp lại cho đến khi hoàn thành mục tiêu
Qwen3.7‑Max là một ví dụ rõ ràng cho bước chuyển này: AI không chỉ nói chuyện — mà bắt đầu thực sự làm việc.
Việc các thử nghiệm tham vọng như chạy tác vụ tự động hàng chục giờ có được tái lập rộng rãi hay không vẫn cần thời gian kiểm chứng. Nhưng xu hướng chung đã rất rõ: thế hệ AI tiếp theo sẽ được thiết kế để hoạt động và thực thi, chứ không chỉ phản hồi.
Alibaba's Qwen3.7 Just Climbed to #13 on AI Arena Without Any ...
Comments
0 comments