答え公開済み2 か月前Last edited 先月18 ソース

Hexo Labsが発表した自己進化AI「SIA」がAIの未来を変える

Hexo Labsがオープンソースで公開した自己改善AI「SIA」は、ソフトウェア構造（ハーネス）とモデルの重みの両方を単一ループ内で更新することを目指すフレームワーク [1][8]。 arXivに投稿された論文では、Prannay Hebbar氏ら7名を著者とし、フィードバックを行うメタエージェントがタスク実行エージェントのハーネスと重みを更新する二重構造アーキテクチャが説明されている [1][2]。

Studio Global AIで検索して事実確認さらにトレンドページを見る

Abstract visualization of a self-improving AI agent architecture from Hexo Labs — What is Hexo Labs' SIA, the open-source AI agent framework that claims to be the first capable of autonomously improving both its own softwaSIA, an open-source agent from Hexo Labs, uses a Feedback-Agent to update both harness and model weights in a single loop.
AI プロンプト
Create a landscape editorial hero image for this Studio Global article: What is Hexo Labs' SIA, the open-source AI agent framework that claims to be the first capable of autonomously improving both its own softwa. Article summary: ## What SIA Is. Topic tags: general, academic, general web, user generated. Reference image context from search candidates: Reference image 1: visual subject "# AI Entrepreneurs at Hexo Labs Release SIA: An Open Source “Self-Improving AI” That Accelerates Superintelligence. After three years of research, Hexo Labs has developed* *the wor" source context "AI Entrepreneurs at Hexo Labs Release SIA: An Open Source “Self ..." Reference image 2: visual subject "# Hexo Labs Develops Self Improving AI (SIA) and Launches it as an Open Source Project. Into that stream steps Hexo Labs with SIA (Self‑Improving‑AI), an open‑source agent that its" source context "Hexo Labs
openai.com

SIAとは何か

SIA（Self-Improving AI） は、Hexo Labsが発表したオープンソースのAIエージェントフレームワークです。最大の特徴は、エージェントの「ハーネス（Harness）」と呼ばれるソフトウェア的な骨組みと、その基盤となるモデルの「重み（Weights）」の両方を、一つの自己改善ループの中で同時に更新できる点にあります。論文の著者は、Prannay Hebbar、Yogendra Manawat、Samuel Verboomen、Alesia Ivanova、Selvam Palanimalai、Kunal Bhatia、Vignesh Baskaranの各氏です。

アーキテクチャ

SIAは、タスクを実行するエージェントを2つの要素に分割し、それを自己改善ループに組み込んでいます。

タスク実行エージェント（Task-Agent）：実際に与えられたタスクを遂行するモデル部分です。
メタエージェント／フィードバックエージェント（Meta-Agent/Feedback-Agent）：LLMをベースとしたエージェントで、タスク実行エージェントのパフォーマンスを分析し、改善のための更新を指示する役割を担います。

フィードバックエージェントは、具体的に次の2種類の更新を行います。

ハーネスの更新：プロンプトの指示文、ツールの使用ロジック、ワークフローといった「ソフトウェア的な構造」に対する編集です。
重みの更新：タスク実行エージェントそのもののモデル重みに対する直接的な更新です。

SIAの価値の核心は、この 「ハーネスと重み」の二つを同時に改善する ことにあります。論文では、この組み合わせによるアプローチが、ハーネスのみを更新する従来型の反復手法を、試した全てのベンチマークで上回ったと報告されています。

ベンチマーク結果

論文では、性質の大きく異なる3つの領域でSIAの評価が行われました。中国の法律文書に基づく罪名分類、GPUの低レベルカーネル最適化、そしてシングルセルRNA（scRNA-seq）データのノイズ除去です。

評価領域	評価指標	結果
中国法の罪名分類（LawBench）	ベースラインからの精度向上	56.6%の改善
GPUカーネル最適化	ベースラインからの実行時間短縮	91.9%の削減
シングルセルRNAのノイズ除去	ベースラインからの性能向上	502%の向上

特にLawBenchでは、191種類に及ぶ罪名を中国語の判決文から予測するという高度なタスクにおいて、56.6%の大幅な性能向上が確認されました。これらの数字は、arXivに投稿された複数のバージョンの論文で一貫して報告されているものです。

「超知能を350倍加速」という主張について

Hexo Labsのプレスリリースでは、SIAが超知能への道のりを「350倍」加速させるとの主張がなされています。しかし、この「350倍」という具体的な数値を裏付ける学術的なベンチマーク結果は、引用された論文資料からは確認できません。論文で示されている主な成果は、上記の3分野における顕著なパフォーマンス向上です。

既存技術との違い

ハーネスのみの改善手法との比較

従来のエージェント改善手法の多くは、プロンプトやワークフローといった表面的な「足場（Scaffold）」の調整に留まっていました。SIAの明確な差別化要因は、このハーネスに加えてモデル内部の重み自体も同時に進化させる点にあります。論文では、この二重の更新レバーを組み合わせることで、足場だけを反復的に改善する手法に対し、3つのベンチマーク全てで優位性を示したと明確に結論づけています。

Nous Researchの「Hermes Agent」との比較

同じく「自己改善」を謳うエージェントとして、Nous Researchが開発したHermes Agentが比較対象として挙げられます。Hermesは、タスクの成功体験から「スキル」を作成・保存・再利用することで、利用とともに性能が向上する学習ループを内蔵しているのが特徴です。

両者のアプローチは方向性が異なります。

Hermes Agent：経験から「スキル」を生成し、持続的な知識として蓄積・活用することで、セッションを超えた「深まりゆく理解」を構築します。
SIA：タスク特化型エージェントに対し、フィードバックループを通じて「ハーネス」と「重み」そのものを直接更新し、根本的な性能向上を図ります。

Hexo Labsは、SIAを「人間の行動からではなく、自分自身から学習する世界初のエージェント」と表現しています。論文における新規性の主張は、まさにこの「ハーネスと重みの同時更新メカニズム」に立脚しています。

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

Studio Global AIで検索して事実確認

人々も尋ねます