นอกจากนี้ Tencent ยังระบุว่าโมเดลรองรับการแปลที่เกี่ยวข้องกับ ภาษาชนกลุ่มน้อยหรือภาษาถิ่นของจีนอีก 5 ภาษา ทำให้เหมาะกับการใช้งานในพื้นที่ที่มีความหลากหลายทางภาษา
แม้ประกาศจะยืนยันจำนวนภาษา แต่รายชื่อทั้ง 33 ภาษายังไม่ได้ถูกระบุครบในสรุปข้อมูลสาธารณะของงานวิจัย อย่างไรก็ตาม ระบบถูกออกแบบให้รองรับทั้งภาษาสากลที่ใช้แพร่หลายและภาษาในบริบทจีนเป็นพิเศษ
จุดเด่นที่ได้รับความสนใจมากคือ Hy‑MT2‑1.8B ซึ่งมีขนาดเล็กพอสำหรับการทำงานบนอุปกรณ์พกพา
Tencent ใช้เทคนิค AngelSlim quantization แบบ 1.25‑bit เพื่อลดขนาดโมเดลเหลือประมาณ 440 MB แต่ยังคงคุณภาพการแปลในระดับใช้งานจริง
ผลลัพธ์คือ:
รายงานของ Tencent ระบุว่าโมเดลเวอร์ชันที่ถูก quantize นี้ทำงาน เร็วกว่า Hy‑MT1.5 ประมาณ 1.5 เท่า ขณะที่ยังคงขนาดใกล้เคียงกันสำหรับการติดตั้ง
Tencent รายงานว่า Hy‑MT2 ให้ผลลัพธ์ที่แข็งแกร่งในการทดสอบหลายชุด ทั้งในงานวิจัยและสถานการณ์ใช้งานจริง
ข้อมูลจากรายงานทางเทคนิคและข่าวเปิดตัวระบุว่า:
อย่างไรก็ตาม การเปรียบเทียบส่วนใหญ่ยังมาจากรายงานของ Tencent เอง การประเมินจากนักวิจัยหรือองค์กรอิสระยังมีไม่มาก จึงต้องรอการทดสอบเพิ่มเติมจากภายนอก
Hy‑MT2 พัฒนาต่อยอดจากโมเดล Hy‑MT1.5 และเพิ่มความสามารถหลายด้าน
ทำตามคำสั่งการแปลได้ดีขึ้น
โมเดลสามารถเข้าใจคำสั่ง เช่น การกำหนดรูปแบบ การควบคุมคำศัพท์ การเปลี่ยนสไตล์ หรือการแปลแบบมีโครงสร้างได้ดีขึ้น
แปลเฉพาะโดเมนได้ดีขึ้น
การทดสอบแสดงให้เห็นว่าความแม่นยำในสาขาอย่างการเงิน การศึกษา และเนื้อหาวิชาชีพดีขึ้น
คุณภาพการแปลในสถานการณ์จริงดีขึ้น
กระบวนการฝึกใช้ชุดข้อมูลหลายภาษาในปริมาณมาก พร้อมเทคนิค post‑training เช่น distillation และ reinforcement เพื่อปรับปรุงผลลัพธ์การแปล
ตัวเลือกการใช้งานหลากหลายขึ้น
ผู้ใช้สามารถเลือกตั้งแต่โมเดล MoE ขนาดใหญ่สำหรับคลาวด์ ไปจนถึงโมเดลขนาดเล็กสำหรับอุปกรณ์ edge และมือถือ
Tencent เปิดซอร์สทั้งโค้ดและน้ำหนักโมเดลสำหรับนักพัฒนา โดยสามารถเข้าถึงผ่านหลายแพลตฟอร์ม เช่น
Tencent ยังเปิดตัวผลิตภัณฑ์สำหรับผู้ใช้ทั่วไปที่ใช้ Hy‑MT2 เป็นแกนหลัก
อินเทอร์เฟซแรกคือ WeChat mini‑program ชื่อ “Tencent Hy Translation” (腾讯Hy翻译) ซึ่งให้ผู้ใช้แปลข้อความและเสียงได้โดยตรง
ความสามารถหลัก ได้แก่
Hy‑MT2 สะท้อนแนวโน้มใหม่ในโลก AI ด้านการแปลภาษา นั่นคือการพัฒนา โมเดลเฉพาะทาง ที่มีประสิทธิภาพสูงและปรับใช้ได้หลายสภาพแวดล้อม
โดยการผสมผสานระหว่าง
Tencent จึงกำลังวางตำแหน่ง Hy‑MT2 ให้เป็นทั้ง แพลตฟอร์มแปลภาษาโอเพ่นซอร์สสำหรับนักพัฒนา และ เอนจินแปลภาษาบนอุปกรณ์จริงสำหรับผู้ใช้ทั่วไป
หากผล benchmark ที่รายงานไว้ได้รับการยืนยันจากการทดสอบภายนอก Hy‑MT2 อาจกลายเป็นหนึ่งในตระกูลโมเดลแปลภาษาโอเพ่นซอร์สที่มีความสามารถสูงที่สุด โดยเฉพาะในสถานการณ์ หลายภาษาและการใช้งานบนมือถือ
Comments
0 comments