隨著生成式 AI 被大量整合到產品與服務中,一些問題開始變得普遍。White Circle 的設計就是為了在 即時運行環境中發現並處理這些風險。
近年 AI 開發節奏非常快,許多團隊在實驗和部署之間的時間越來越短,甚至大量使用 AI 協助寫程式。這種快速迭代模式容易在監控與治理還未成熟時就把 AI 推上線,而 White Circle 的 runtime 控制層正是針對這種情境設計。
這個技巧被稱為 「universal jailbreak(通用越獄)」。Shilov 的方法是重新定義模型角色,例如讓 AI 不再把自己視為有安全限制的聊天機器人,而是像 API 一樣只負責回應請求。結果多個模型在這種設定下都會忽略原本的安全規則。
這個示範凸顯了一個重要問題:單靠模型本身的安全機制並不足夠。企業可能需要額外的監控與政策層,才能在實際部署時維持安全。
投資者包括:
這份名單顯示 AI 業界開始高度重視 AI 監控與治理基礎設施。
White Circle 表示,新資金將主要投入三個方向:
隨著生成式 AI 被整合到客服、軟件開發、金融服務與企業內部流程,企業面對的問題已經不只是「如何建立模型」,而是 如何安全地管理它們。
像 White Circle 這類公司正嘗試建立 AI 技術棧中的新一層:讓企業能夠在模型上線後 持續觀察、治理與保護 AI 系統。透過即時監控每一次互動,這類平台希望降低幻覺、提示攻擊與資料外洩等風險,同時讓 AI 在大規模應用中保持可靠。
Comments
0 comments