Tencent Cloud последовательно выстраивает экосистему, где разработчики и бизнес получают готовый к использованию «замкнутый» контур разговорного искусственного интеллекта. Ключевой элемент здесь — платформа Tencent Real-Time Communication (TRTC, или Tencent RTC), глобальная инфраструктура реального времени, которая теперь обогащается не собственными языковыми моделями, а лучшими в своем классе решениями от профильных стартапов. В июне 2026 года компания объявила о двух стратегических альянсах: с Soniox (распознавание речи) и Inworld AI (синтез речи). Рассказываем, что именно получает бизнес и чем примечательны эти сделки.
Объявлено: 2 июня 2026 года .
Что внедрено: Высокоточный и быстрый движок распознавания речи (Speech-to-Text, STT) компании Soniox. Его главные особенности — точность на уровне носителя языка для более чем 60 языков и настоящая поддержка переключения языка на лету: например, фраза может начаться на английском, а закончиться на китайском, и система корректно обработает каждое слово .
Как работает с TRTC: Технология Soniox подключается к глобальной магистрали передачи данных Tencent RTC, которая насчитывает свыше 3200 узлов и обеспечивает задержку менее 300 миллисекунд по всему миру. Дополнительно работают фирменные алгоритмы шумоподавления на базе ИИ и устойчивость к нестабильному сигналу .
Итог для бизнеса: Полный цикл от захвата звука до готового текста значительно ускоряется. Это позволяет запускать многоязыковые голосовые сервисы — поддержку клиентов, голосовых ассистентов, синхронный перевод, транскрибацию совещаний — в более чем 200 странах .
Доступ: API распознавания Soniox можно активировать прямо в консоли Tencent Cloud .
Объявлено: 16 июня 2026 года .
Что внедрено: Флагманская модель синтеза речи (Text-to-Speech, TTS) Realtime TTS-2 от исследовательской лаборатории Inworld AI, доступная в формате исследовательского превью [4, 40]. В рейтинге Artificial Analysis Speech Arena эта модель занимает первое место среди решений для реального времени. Отличительная черта — «осведомленность о разговоре»: модель анализирует полный аудиоконтекст, улавливает тон, темп и эмоциональное состояние, а управлять голосом можно простыми фразами вроде «будь бодрее» на любом из 200+ поддерживаемых языков [2, 14].
Как работает с TRTC: Inworld TTS встраивается как готовый компонент в экосистему Tencent RTC через уже существующий интерфейс StartAIConversation, который поддерживает интеграцию со сторонними TTS-системами .
Итог для бизнеса: Разработчик получает закрытый стек (распознавание → большая языковая модель → синтез речи), где ответ звучит эмоционально созвучно ситуации, а один и тот же персонаж сохраняет узнаваемый голос на любом языке [2, 4].
Оба партнерства закрывают базовые сенсорные блоки разговорного ИИ на инфраструктуре TRTC. Вместо многолетней разработки собственных моделей Tencent Cloud предлагает бизнесу готовую, распределенную по миру платформу с предустановленным «слухом» и «голосом» от узкопрофильных лидеров.
Это часть более широкой стратегии. Ранее компания заключила соглашение со Stream (фреймворк Vision Agents) для создания мультимодальных ИИ-агентов , а 16 июня на конференции Tencent Cloud Day Korea представила портфель интегрированных ИИ-агентов
. Все шаги направлены на то, чтобы сделать TRTC стандартной транспортной средой для реального времени в ИИ-приложениях, ориентированных на развивающиеся рынки и многоязычную аудиторию.
Studio Global AI
Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.
За две недели июня 2026 года Tencent Cloud объявил о двух знаковых партнерствах в сфере голосового искусственного интеллекта: с Soniox (2 июня) и Inworld AI (16 июня).
За две недели июня 2026 года Tencent Cloud объявил о двух знаковых партнерствах в сфере голосового искусственного интеллекта: с Soniox (2 июня) и Inworld AI (16 июня). Сделки закрывают два критических звена для разговорного ИИ — «слух» (распознавание речи) и «речь» (синтез речи) — на базе глобальной сети TRTC.
Soniox предлагает сверхточное распознавание речи на 60+ языках с мгновенным переключением между ними прямо внутри одного предложения [5].
Loading comments...
Comments
0 comments