答案已發布2 個月前Last edited 上個月19 個來源

Hexo Labs 發布 SIA：宣稱全球首個自主優化軟體骨架與模型權重的自進化 AI

SIA（Self Improving AI）是什麼？ Hexo Labs 發表的開源自進化代理框架，宣稱能在單一迴圈中同時優化代理的程式骨架（Harness）與底層模型權重 [1][8]。論文作者群為 Prannay Hebbar、Yogendra Manawat、Samuel Verboomen、Alesia Ivanova、Selvam Palanimalai、Kunal Bhatia 與 Vignesh Baskaran [1]。

使用 Studio Global AI 搜尋並查證事實瀏覽更多熱門頁面

Abstract visualization of a self-improving AI agent architecture from Hexo Labs — What is Hexo Labs' SIA, the open-source AI agent framework that claims to be the first capable of autonomously improving both its own softwaSIA, an open-source agent from Hexo Labs, uses a Feedback-Agent to update both harness and model weights in a single loop.
AI 提示詞
Create a landscape editorial hero image for this Studio Global article: What is Hexo Labs' SIA, the open-source AI agent framework that claims to be the first capable of autonomously improving both its own softwa. Article summary: ## What SIA Is. Topic tags: general, academic, general web, user generated. Reference image context from search candidates: Reference image 1: visual subject "# AI Entrepreneurs at Hexo Labs Release SIA: An Open Source “Self-Improving AI” That Accelerates Superintelligence. After three years of research, Hexo Labs has developed* *the wor" source context "AI Entrepreneurs at Hexo Labs Release SIA: An Open Source “Self ..." Reference image 2: visual subject "# Hexo Labs Develops Self Improving AI (SIA) and Launches it as an Open Source Project. Into that stream steps Hexo Labs with SIA (Self‑Improving‑AI), an open‑source agent that its" source context "Hexo Labs
openai.com

什麼是 SIA？

SIA（Self-Improving AI，自進化人工智慧） 是由 Hexo Labs 提出的開源代理框架，其核心主張在於它是一套能「自我進化」的系統，能在單一迴圈中同時更新自身的程式骨架（Harness） 與底層模型權重 。這篇發表於 arXiv 的論文，作者群包括 Prannay Hebbar、Yogendra Manawat 與 Vignesh Baskaran 等人。在 Hexo Labs 於 2026 年 5 月 28 日正式發布的公開聲明中，SIA 被定位為一項開源專案。

對台灣的技術社群而言，這代表的是一種新的系統設計思維：過往代理的自我優化，多半停留在「改 Prompt」的層次，但 SIA 試圖證明，如果能讓 AI 自行調整模型參數，優化的天花板將完全不同。

架構解析：雙代理、雙重回饋的自我優化迴圈

SIA 將一個任務導向的 AI 系統拆成兩個角色，並讓它們在一個封閉的優化迴圈內協同運作：

任務代理（Task-Agent）
實際執行目標任務的模型，例如法律罪名分類、GPU 核心程式碼最佳化等。
回饋代理（Feedback-Agent）/ 元代理（Meta-Agent）
這是一個以大型語言模型（LLM）為基礎的代理，它的職責不是直接執行任務，而是「監督與優化」任務代理。它會根據任務代理的表現，發布兩種類型的更新指令：
1. Harness 更新（骨架更新）
  修改代理的系統提示、工具調用邏輯、重試機制等外部工作流設定。
2. 權重更新（Weight Update）
  直接調整任務代理的模型參數本身。

這套設計的關鍵論點在於：在所有測試的基準上，結合兩種更新手段的表現，均優於僅更新骨架的迭代方式 。對習慣微調 AI 模型的工程師來說，這就像讓模型同時擁有「自主編寫 workflow」與「自主 fine-tune」的能力，而且是在同一個 closed loop 中完成。

實測成績：三大領域的跨域驗證

論文在三個截然不同的領域上對 SIA 進行了評估，以此證明其泛用性：

領域	評估指標	實測結果
中文法律罪名分類（LawBench）	準確度提升幅度	相較基線提升 56.6%
GPU 核心（Kernel）最佳化	執行時間縮減幅度	相較基線減少 91.9% 的執行時間
單細胞 RNA 降噪（Denoising）	改善幅度	相較基線提升 502%

補充說明：現有論文版本中，LawBench 回報的數據為 56.6% 的相對增益，並未提供一個獨立的最終絕對準確率數字。其餘兩項（91.9% 運行時間縮減與 502% 降噪增益）同樣來自論文版本 v1 與相關報導。

「加速超級智慧 350 倍」的主張

Hexo Labs 的公開聲明中，將 SIA 描述為一個能「加速超級智慧發展」的開源自進化 AI，並提到一個「350 倍」的加速指標。然而，該「350 倍」的具體數字並未出現在現有的學術論文或技術文件中，論文實際呈現的，仍然是上述三項跨領域的基準測試成績。讀者在參考相關報導時，可將其視為公司願景層級的表述，而非論文中直接驗證的技術指標。

與競品的核心差異：Hermes Agent vs. SIA

與純骨架迭代的差異
SIA 與傳統做法最大不同，在於它同時更新 Harness 與權重這兩個維度。論文中直接對比的對象正是「僅迭代骨架」的方法，而結果顯示，雙重更新在所有三項基準測試上都顯著勝出。
與 Nous Research 的 Hermes Agent 的比較
Hermes Agent 是另一套由 Nous Research 開發的自進化 AI 框架。根據 Hermes 的官方文件，它具備內建的學習迴圈，能從任務經驗中創造「技能（Skill）」、在使用過程中持續優化，並讓知識跨任務積累。它的學習機制偏向於技能記憶、跨時間的效能疊加，以及對使用者的深度建模。

相比之下，SIA 的進化路徑更偏向「架構參數化」：它不僅優化行為邏輯，更直接動態調整模型的內部權重。若用類比來說，Hermes Agent 像是能從經驗中記錄並反覆使用套路的資深工程師；而 SIA 則像是能改寫自己底層程式碼、連思考方式都能隨任務重塑的系統。

Hexo Labs 將 SIA 定位為「全球第一個從自身經驗學習，而非仰賴人類動作的代理」。論文的技術新穎性主軸，也確實落在這個雙重回饋機制上：將 Harness 與權重更新整合在同一個優化迴圈裡。

補助計畫與生態圈

Hexo Labs 在官網上公布了「前沿研究補助計畫（Frontier Research Grants）」，為學研團隊提供資金、SIA 基礎設施存取權及商業化機會。官方文件顯示，該計畫旨在讓外部研究者也能直接使用 SIA 的實驗環境，並與 Hexo Labs 團隊直接協作。

讀者提醒：關於「1000 萬美元補助基金」的細節，在 SIA 專案相關的來源文件中並未明確載明，相關金額數字建議以官方補助頁面的最新公告為準。

對於台灣的 AI 新創或學術實驗室來說，這類開源自進化框架的出現，提供了一個直接測試「自主模型優化」落地方案的實驗場。有興趣的團隊可關注其 GitHub 倉庫與官方補助申請頁面。

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

使用 Studio Global AI 搜尋並查證事實

大家也會問