Ngoài ra, Tencent cho biết hệ thống cũng hỗ trợ 5 ngôn ngữ hoặc phương ngữ dân tộc tại Trung Quốc, giúp mở rộng khả năng ứng dụng ở các khu vực đa ngôn ngữ.
Các bản tóm tắt công khai chưa liệt kê đầy đủ danh sách 33 ngôn ngữ, nhưng rõ ràng hệ thống tập trung mạnh vào các kịch bản dịch giữa tiếng Trung và nhiều ngôn ngữ toàn cầu phổ biến.
Điểm nổi bật nhất của Hy‑MT2 là khả năng triển khai cực nhẹ của phiên bản 1.8B.
Nhờ vậy, mô hình có thể:
Theo báo cáo của Tencent, bản quantized này cũng nhanh hơn khoảng 1.5 lần so với Hy‑MT1.5 dù kích thước triển khai tương đương.
Theo báo cáo kỹ thuật và thông tin từ phía Tencent, Hy‑MT2 đạt kết quả mạnh trên nhiều benchmark dịch thuật.
Một số điểm đáng chú ý:
Tuy vậy, phần lớn các con số hiện vẫn đến từ báo cáo của Tencent; các đánh giá độc lập từ bên thứ ba vẫn còn hạn chế.
Hy‑MT2 là bước nâng cấp của dòng Hy‑MT1.5 trước đó và mang lại một số cải tiến chính.
Tuân thủ chỉ dẫn dịch tốt hơn
Mô hình hiểu rõ các yêu cầu như giữ thuật ngữ, thay đổi phong cách, hoặc dịch theo cấu trúc định dạng.
Dịch chuyên ngành mạnh hơn
Các thử nghiệm cho thấy cải thiện đáng kể trong các lĩnh vực như tài chính, giáo dục và các bối cảnh chuyên môn.
Chất lượng dịch thực tế tốt hơn
Quy trình huấn luyện sử dụng tập dữ liệu đa ngôn ngữ lớn cùng các kỹ thuật hậu huấn luyện như distillation và reinforcement để tối ưu kết quả.
Triển khai linh hoạt hơn
Hệ sinh thái mô hình trải dài từ bản MoE quy mô lớn trên cloud đến bản siêu nhẹ cho thiết bị edge.
Tencent đã công bố mã nguồn và trọng số mô hình cho cộng đồng phát triển.
Các kênh truy cập chính gồm:
Các mô hình được thiết kế để chạy trên nhiều nền tảng phần cứng khác nhau như ARM, Intel và nhiều kiến trúc server phổ biến.
Phiên bản 1.8B đặc biệt hướng tới triển khai cục bộ (local deployment) trên thiết bị edge và di động.
Tencent cũng đã ra mắt sản phẩm dịch dành cho người dùng dựa trên Hy‑MT2.
Giao diện đầu tiên là mini‑program WeChat “Tencent Hy Translation” (腾讯Hy翻译), cho phép:
Tencent cho biết ứng dụng iOS và Android chuyên dụng đang được phát triển và sẽ hỗ trợ suy luận cục bộ trên thiết bị.
Hy‑MT2 phản ánh một xu hướng mới trong AI dịch thuật: thay vì chỉ dựa vào các mô hình đa năng khổng lồ, các công ty đang xây dựng mô hình chuyên biệt cho từng nhiệm vụ.
Trong trường hợp của Tencent, Hy‑MT2 kết hợp ba yếu tố quan trọng:
Nếu các kết quả benchmark được xác nhận rộng rãi hơn, Hy‑MT2 có thể trở thành một trong những bộ mô hình dịch mã nguồn mở mạnh nhất, đặc biệt cho các kịch bản đa ngôn ngữ và dịch trực tiếp trên thiết bị di động.
Comments
0 comments