CSM 目前有由 10 億到 80 億參數嘅唔同大細版本,刻意整到咁輕量,就係為咗日後可以塞入消費級甚至穿戴式硬件度離線運行 [34, 9]。佢哋仲將一個 10 億參數嘅版本喺 GitHub 開源咗出嚟,用嘅係 Apache 2.0 授權,checkpoint 放咗喺 Hugging Face [53, 42]。
目前你可以喺 CSM 上面用到兩把「有名有姓」嘅 AI 聲音:Maya 同 Miles [33, 34]。
Sesame 喺 App Store 話自己係「私隱優先」,指用家同 Sesame 之間嘅對話「安全並以私隱為設計基礎」。佢哋份正規私隱政策最後更新係 2026 年 5 月 7 日,解釋咗點樣通過網站、App 同服務(包括虛擬對話代理)收集同處理用戶數據
。
不過,現有嘅公開文件 冇講清楚 好多注重私隱嘅用家想搵嗰啲細緻控制權——例如手動刪除對話記錄嘅工具、拒絕被用嚟訓練模型嘅 opt-out 選項、又或者數據會保留幾耐先銷毀。私隱政策入面雖然提及,當唔再需要個人資訊嗰陣,會按適用法律銷毀、刪除或者匿名化,但就冇畀出實際嘅時間表或者用戶可以自己申請刪除嘅機制 。
把聲呢種數據天生就敏感,仲有可能涉及生物辨識,隨住 Sesame 規模擴大同各地監管機構收緊 AI 數據處理規例,呢個模糊位肯定會被人攞放大鏡照。想睇清條款嘅用家,可以去 sesame.com/privacy 搵完整政策。
Sesame 出個 App,其實只係「手段」,「終點」係將佢哋嘅語音 AI 塞入一副輕巧、可以戴足全日嘅智能眼鏡 [8, 9]。
呢條橋嘅邏輯,一來係技術考量:CSM 嘅輕量級設計(10 億到 80 億參數)本身就係預咗可以直接喺眼鏡硬件上面運行,唔使吓吓要駁雲端等回傳,慳返 delay 時間 。二來係商業計算:Sesame 想同時食「軟件訂閱月費」同埋「賣硬件嘅高利潤」兩條水,如果將 AI 把聲塞入自己嘅眼鏡,佢哋就可以全盤控制咪高峰點收聲、喚醒詞、延遲、電量同訂閱 bundle,而唔使困喺第三方 App 生態系統度同人爭
。
正如有分析指出:「Sesame 硬件計劃真正嘅寶藏,唔係賣 gadget 賺嗰筆錢,而係霸住『語音模型成日要黐住嗰個預設裝置』。只要 Maya 同 Miles 住喺 Sesame 自己嘅眼鏡入面,佢就可以決定所有體驗細節,令 AI 同伴感覺似裝置一部分,多過似一個 App 。」
創辦團隊喺 Oculus 同 Meta 砌過 VR/AR 硬件嘅往績,令呢個硬件野心多咗幾分可信性,唔似得純軟件初創咁得個噏字 。公司公開承諾眼鏡會有「高品質音頻」,仲有個可以「同你一齊觀察世界」嘅 AI 伴侶 [38, 44]。有報導提及會整合眼球追蹤技術同實時對話回饋,但具體技術規格仍然好神秘
。
2025 年 10 月 21 日,Sesame 完成咗 2.5 億美元嘅 B 輪融資,之前已經攞過 Andreessen Horowitz 嘅錢 [45, 40]。投資者仲包括 Sequoia Capital,佢哋甚至出咗篇長文解釋點解睇好語音主導 AI 係人機互動嘅重大轉變 。
Sesame 踩入嘅呢個市場,Apple、Google、Amazon 同 OpenAI 全部都有龐大用戶基礎嘅語音助手。Sesame 想突圍,要押注三樣嘢:
風險當然唔細。大公司有錢有人,可以慢慢追語音質素。音頻硬件出名難設計同量產,仲要整到輕到可以戴全日,又要夠型棍先有人肯戴上街。而圍繞把聲數據嗰啲私隱漏洞,正正喺 Sesame 嘗試建立信任嘅時候,隨時會引爆用戶同監管機構嘅反彈。
Sesame 嗰種「對話溫暖感」同硬件野心,究竟可唔可以挖出一條防守到嘅護城河?隨住 iOS App 推出同之後嘅眼鏡面世,答案將會慢慢浮面。
Comments
0 comments