Además, Tencent señala que el sistema también soporta traducción que involucra cinco lenguas o variantes dialectales de minorías en China, ampliando su uso en regiones altamente multilingües.
Las publicaciones públicas confirman el total de 33 idiomas, aunque los resúmenes disponibles del informe técnico no enumeran la lista completa en detalle. Lo que sí queda claro es que el sistema está especialmente optimizado para escenarios multilingües con fuerte presencia del chino, junto a idiomas internacionales ampliamente usados.
Uno de los aspectos más llamativos del lanzamiento es el tamaño del modelo Hy‑MT2‑1.8B.
Tencent utiliza una técnica propia llamada AngelSlim con cuantización extrema de 1.25 bits, que reduce el tamaño del modelo a aproximadamente 440 MB sin perder utilidad práctica para la traducción.
Esto permite varias cosas importantes:
Según la compañía, esta versión cuantizada también es aproximadamente 1,5 veces más rápida que la generación anterior Hy‑MT1.5 con un tamaño similar de despliegue.
Tencent informa resultados sólidos en diferentes evaluaciones de traducción.
Entre las afirmaciones principales:
Sin embargo, gran parte de estas comparaciones provienen del propio informe técnico y material de lanzamiento de Tencent, por lo que las evaluaciones independientes todavía son limitadas.
Hy‑MT2 se basa en la generación previa Hy‑MT1.5, introduciendo varias mejoras importantes.
Mejor seguimiento de instrucciones
Los modelos interpretan mejor instrucciones de traducción complejas, como control de estilo, terminología específica o tareas estructuradas.
Mayor precisión en dominios profesionales
Las evaluaciones destacan mejoras en áreas especializadas como finanzas, educación u otros contextos técnicos.
Calidad más robusta en escenarios reales
El pipeline de entrenamiento utiliza grandes conjuntos de datos multilingües junto con técnicas de post‑entrenamiento como destilación y refuerzo para mejorar la calidad final de traducción.
Más opciones de despliegue
La familia ahora cubre desde modelos ligeros para edge, hasta modelos MoE a escala de nube para traducción profesional.
Tencent publicó los modelos y el código para desarrolladores en varias plataformas:
Los modelos están adaptados para ejecutarse en múltiples arquitecturas de hardware, incluyendo procesadores ARM y servidores comunes.
El modelo pequeño está especialmente orientado a implementaciones locales, por ejemplo en dispositivos edge o smartphones.
Además del lanzamiento técnico, Tencent ya lanzó productos para consumidores basados en Hy‑MT2.
El primero es el mini‑programa de WeChat “Tencent Hy Translation” (腾讯Hy翻译), que permite traducir texto o voz utilizando estos modelos.
Entre sus funciones:
Tencent también ha indicado que planea apps dedicadas para iOS y Android, que incluirán inferencia local en el dispositivo.
Hy‑MT2 refleja una tendencia creciente en IA: pasar de modelos generales gigantes a sistemas especializados más eficientes.
En este caso, Tencent combina:
El resultado es un ecosistema que puede funcionar tanto como stack abierto de traducción para desarrolladores como motor práctico de traducción en el dispositivo.
Si los resultados reportados se confirman en evaluaciones independientes, Hy‑MT2 podría convertirse en una de las familias de modelos de traducción abierta más potentes, especialmente para escenarios multilingües y móviles.
Comments
0 comments