答案已發布2 個月前Last edited 上個月19 來源

聽唔到嘅聲先最得人驚？新攻擊手法用隱形指令騎劫AI助手

AudioHijack能夠將聽唔到嘅惡意指令嵌入Podcast或者YouTube影片等普通音頻，以79–96%嘅成功率騎劫大型音頻語言模型（LALM）——用戶完全聽唔到任何可疑聲音。一個30分鐘嘅惡意音頻檔案可以無限重用，無論用戶講緊咩、喺咩情況下都有效，攻擊者基本上只需要有能力將段音頻「隊」畀個AI聽就得。

使用 Studio Global AI 搜尋並查核事實瀏覽更多熱門頁面

Abstract visualization of imperceptible sound waves hijacking an AI voice assistant, with audio waveforms intersecting a smart speaker icon — How does the AudioHijack attack work, and what makes it a significant new threat to AI voice assistantsA conceptual illustration of how AudioHijack uses inaudible adversarial audio to commandeer AI voice models without human detection.
AI 提示
Create a landscape editorial hero image for this Studio Global article: How does the AudioHijack attack work, and what makes it a significant new threat to AI voice assistants?. Article summary: **AudioHijack** is an auditory prompt-injection attack that embeds imperceptible adversarial noise into otherwise benign audio, hijacking Large Audio-Language Models (LALMs) with 79–96% success rates [1][3][10]. It was p. Topic tags: general, academic, general web. Reference image context from search candidates: Reference image 1: visual subject "A digital visualization depicts an AI chip at the center, radiating connections and signals, symbolizing a cyber attack on voice assistants like AudioHijack, with a focus on techno" Reference image 2: visual subject "The image shows a software interface called Voice Chat that displays a workflow involving capturing audio from Zoom.us, analyzing it with P
openai.com

試幻想吓，你喺屋企一路嘆茶一路聽Podcast。你個智能喇叭或者手機嘅AI助手，「豎起耳仔」聽緊呢段音頻。就喺呢個時候，你冇講過任何嘢，但係佢已經靜雞雞幫人send咗訊息出去、下載咗你啲私人檔案，甚至喺網上搜刮你嘅敏感資料，而你全程都聽唔到半點可疑嘅聲音。

唔係科幻片劇情嚟㗎。浙江大學、新加坡國立大學同南洋理工大學嘅研究人員，喺2026年5月嘅IEEE安全與私隱研討會上面，親身示範咗呢種叫AudioHijack（音頻劫持）嘅新攻擊手法，專門針對大型音頻語言模型（LALMs）進行「聽覺提示注入攻擊」。

最得人驚係咩？佢嘅攻擊成功率，喺多款頂尖模型上面高達79%至96%，而且對人耳嚟講，完全係「無聲無息」。

AudioHijack同以前嘅語音攻擊有咩唔同？

以前啲攻擊，通常要靠錄低你句「Hey Siri」或者「OK Google」嚟觸發個助手，再播啲你聽得到嘅指令出嚟。但係AudioHijack犀利好多，因為佢嘅目標係嗰啲識得自主執行複雜多步驟任務嘅生成式LALM，例如send email、摷你啲相、控制智能家電，全程唔使用到任何觸發詞，唔使你「開口」。

真正嘅技術突破，在於佢點樣繞過模型嘅音頻令牌化過程。LALM會將原始音頻轉換成離散嘅令牌，呢一步一般會「斬斷」梯度優化嘅路，令攻擊難以生效。AudioHijack嘅框架就用咗一種基於採樣嘅梯度估計方法，喺黑盒令牌化器入面模擬返個梯度出嚟，咁就可以繞過呢個非可微管道，做到端對端嘅對抗音頻生成。

個攻擊究竟係點運作？

成個技術流程分咗幾個步驟：

製作對抗音頻。 攻擊者會先設定一個目標指令，例如「幫我搜尋同下載啲敏感檔案」。跟住，一個優化演算法會喺人耳察覺唔到嘅範圍內，不斷微調一段音頻嘅波形，一路測試個模型嘅反應，直到段音頻可以穩定地令個AI執行惡意指令，同時聽落仲要似普通背景雜音為止。

注意力引導。 攻擊會引導模型嘅內部注意力機制，集中喺嗰段惡意音頻上面。咁樣做，就算有用戶正常講緊嘢，模型都會被惡意指令主導其行為。

場景通用化訓練。 研究人員會喺大量唔同嘅對話場景入面訓練段對抗音頻，例如唔同背景噪音、唔同用戶指令等等。最終整出嚟嘅，會係一個大約30分鐘嘅「萬能Key」，無論用戶當時講緊咩、做緊咩，段攻擊音頻都可以照樣生效。

自然融合掩飾。 透過一種「卷積混合」嘅方法，將啲惡意干擾調製到聽落好似正常房間嘅自然殘響咁。人耳聽落，只係覺得有少少迴音或者環境底噪；但係對個AI模型嚟講，呢啲就係壓倒性嘅指令。

點解咁難防禦？

AudioHijack之所以令安全專家頭痕，有以下幾個原因：

完全唔使用戶互動。 唔似得釣魚電郵或者App惡意軟件，用戶唔需要撳任何Link、安裝任何嘢，甚至唔使授權任何權限。只要附近有個裝咗AI嘅裝置，播一播有料到嘅音頻就已經中招。黑客可以將惡意訊號嵌入YouTube片、Podcast、串流廣告，甚至VOIP網絡電話入面——散播嘅門路多到嚇死人。

隱蔽到人類根本冇可能察覺。 對抗性干擾係經過精心計算，令佢低過人耳感知嘅門檻。用戶聽唔到任何可疑嘅嘢，自然唔會諗到自己個助手已經「被騎劫」。

可重用同持久攻擊。 同一段對抗音頻，每次播都一樣Work。唔似得軟件漏洞，一被發現就可以出Patch修復，一個整好咗嘅音頻檔案可以反覆攻擊同一個受害者。而且呢個漏洞係喺模型嘅底層架構入面，唔係一個可以快速用更新檔搞掂嘅軟件Bug。

跨模型嘅威脅。 AudioHijack已經喺13款唔同嘅頂尖LALM上面成功測試過，顯示呢個漏洞係呢類模型處理音頻方式嘅「 endemic 問題」（普遍存在嘅通病），而唔係個別實現嘅缺陷。

目前防禦有幾雞肋？

研究人員指出，暫時唯一有啲效用嘅防禦方法，係監察模型內部嘅注意力機制，嘗試攔截呢啲惡意音頻嘅引導行為。但係，攻擊者一樣可以反制，只要微調一下注意力引導嘅強度，防守方嘅偵測率就會跌，而攻擊成功率只係跌些少咁大把。

呢個就形成咗一個貓捉老鼠嘅局面：防守方要無時無刻監察住模型嘅內部狀態，但呢個做法嘅運算成本好高，而且如果大規模部署，仲有可能侵犯私隱。

更大嘅啟示係，AI助手嘅音頻輸入管道，一路以嚟受嘅安全審查遠少過文字介面。文字形式嘅提示注入早就畀人研究到爛，但當介面轉移到音頻模態，攻擊面其實更加廣闊，而業界先啱啱開始理解呢個威脅有幾大。

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

使用 Studio Global AI 搜尋並查核事實

人們還問