偵測器係用 AASIST(利用集成頻譜-時間圖注意力網絡嘅音頻反欺騙技術)架構嚟建立,呢個架構贏過 ASVspoof 2021 挑戰賽——呢個係語音反欺騙領域嘅頂尖學術評測標準 。系統可以即時針對 AI 語音複製、重播攻擊同埋語音轉換攻擊,錯誤標示率低過 0.1%,意思係每 1,000 次合法用戶嘅驗證嘗試入面,唔夠 1 次會畀系統錯誤標示成合成語音
。
Voxmind 揀呢個時候推出絕對唔係巧合。隨住三大雲端供應商退出或者縮減業務,聲紋識別市場正經歷緊結構性洗牌。
微軟喺 2025 年 9 月退役咗 Azure 說話者識別服務。AWS 已經唔再接受新客用 Amazon Connect Voice ID,仲會喺 2026 年 5 月 20 號終止所有支援。Google 就靜靜雞由網站移除咗 Speaker ID 嘅產品資料,將聲紋識別方案嘅流量引走晒 。
對於嗰啲靠呢啲服務嚟做認證基礎嘅硬件廠商、客服中心營運商同金融服務公司嚟講,佢哋嘅雲端供應商已經冇長遠路線圖可以提供。SymNex Consulting 創辦人 Matt Smallman 觀察到,當初幫微軟建立聲紋識別能力嘅 Nuance 舊團隊,大部分人都已經走咗,體制知識亦都冇咗 。
呢個撤出潮同 AI 語音複製嘅爆炸性增長同步發生。用免費工具,而家 3 秒嘅語音樣本就已經夠複製一個人把聲,令冇保護嘅語音渠道成為增長得好快嘅詐騙途徑 。全球聲紋識別市場預計到 2034 年會達到 227.6 億美元(約 1,772 億港元),由 2026 年嘅 36.1 億美元基數起計,年複合增長率達 25.88%。呢個數字反映企業正積極物色新嘅專業供應商
。
對於正喺度遷移嘅企業嚟講,佢哋嘅賣點好清晰:一個專業嘅聲紋認證層,可以喺裝置端運行,支援任何語言,預設偵測 AI 複製把聲,仲唔需要雲端連線——由一間全身投入解決呢個問題嘅公司打造,正當巨頭離場嘅時候。
Comments
0 comments