ユーザー体験において決定的に重要なのは、翻訳結果が機械音声のように聞こえない点です。このモデルは、元の話者の抑揚、話すテンポ、声の高さを保持するように設計されており、テキスト読み上げエンジンのようにではなく、話者本人が話しているかのような翻訳音声を生み出します 。
70以上の言語をサポートすることで、モデルは数千もの双方向の言語ペアをカバーします。設計段階から二者間の会話を想定しており、双方の話し手が、相手の言葉を自分の言語に流暢に翻訳された形で聞き取ることができます 。
開発者にとって、このモデルへのアクセスはGemini Live API経由で行われます。オーディオ入力は特定のフォーマットが必要です:リニアPCM 16ビット、サンプルレート16kHz、モノラル、リトルエンディアン。出力される翻訳音声もリニアPCM 16ビットですが、より高い24kHzのサンプルレートで出力されます 。モデルのコンテキストウィンドウ(AIが一度に考慮できる情報量)は、最大128,000トークンの入力と、64,000トークンの出力に対応しています
。
gemini-3.1-flash-live-previewがリリースされ、反復的な開発が進められていました gemini-3.5-live-translate-previewモデルが、開発者向けに「Gemini Live API」と「Google AI Studio」を通じて、また一般ユーザー向けにはAndroidおよびiOSの「Google翻訳」アプリのアップデートを通じて公式にリリースされました このモデルは、Googleの一般消費者、開発者、企業向けの各プラットフォームで、それぞれ異なるアクセスレベルで提供されています。
一般ユーザーにとってはこれが最も簡単な入り口です。この機能は「Google翻訳」アプリ内で世界中に順次展開されています。ヘッドフォンを装着した状態で、アプリ画面の左下にある「Live translate」ボタンをタップするだけです。Android版では、ハンズフリーの「リスニングモード」も展開中で、通常の通話のように端末を耳に当てるだけで、受話スピーカーから翻訳音声が聞こえます 。
開発者向けには、パブリックプレビューとして提供されています。これは、Gemini Live APIを特定の翻訳設定で使用することで、サードパーティ製のアプリやサービスへの組み込みを可能にするものです。「Google AI Studio」も、開発者がモデルの能力をプロトタイプしてテストできるサンドボックス環境を提供します 。
企業向けの提供はより限定的です。Google Meet向けのGemini 3.5 Live Translateは、2026年6月から一部の企業顧客を対象としたプライベートプレビューとして開始されます。利用可能になると、話者の言語を自動検出し、各参加者が希望する言語に翻訳します。会議中に70以上の言語と2,000以上の言語ペアをサポートします。より広範な展開は、2026年後半に予定されています 。この機能は、Google Workspace Business Standard/Plus、Enterprise Standard/Plus、Google AI Pro、Google AI Ultraなどのサブスクリプションで利用可能です
。
Agora、Fishjam、LiveKit、Pipecat、Vision Agentsといったリアルタイムコミュニケーションプラットフォームは、すでにGemini Live APIを自社のメディアパイプラインに統合する作業を進めています 。
最も説得力のある実地試験の一つが、東南アジアのライドシェア・デリバリープラットフォーム「Grab」での取り組みです。Grabは、ドライバーと乗客間のリアルタイム音声翻訳を提供するためにこのテクノロジーを試験導入しています。同社は毎月1,000万件以上の音声通話を処理しており、この実験は言語が細かく分断された市場の課題に正面から取り組むものです 。
逐次翻訳からストリーミング翻訳への移行は、UX(ユーザー体験)の根本的な転換です。Google翻訳やMeetのようなユビキタスな製品に深く統合し、開発者エコシステムに開放することで、Googleはリアルタイム音声翻訳をニッチな機能からグローバルコミュニケーションの標準インフラ層へと押し上げようとしています 。Grabでの実証実験は、瞬間的で自然な翻訳が、目新しさではなく公共料金のようなユーティリティになりつつあることを如実に示しています
。
このモデルによって生成された全てのAI音声には、Googleの「SynthID」技術による電子透かしが埋め込まれます。これは、合成音声技術がより説得力を持ち、広く普及するにつれて、その出自を検出可能にし、悪用の可能性を軽減するための重要な措置です 。
Comments
0 comments