A grande sacada — e a principal reivindicação de novidade — é combinar essas duas alavancas num único ciclo. Segundo o artigo, essa combinação superou a iteração apenas no scaffold em todos os benchmarks testados .
Para validar o conceito, os pesquisadores escolheram três domínios bem diferentes — um teste de fogo para qualquer sistema que se diga generalista :
Nota importante: As fontes acadêmicas disponíveis reportam o resultado do LawBench como um ganho de 56,6%, e não como um número absoluto de acurácia . Os outros dois resultados (91,9% e 502%) também são consistentes entre as versões do artigo no arXiv
.
No anúncio público, o Hexo Labs descreve o SIA como um agente de código aberto que acelera o caminho para a superinteligência . Uma alegação específica de “350×” aparece nesse contexto, mas não é sustentada pelas fontes acadêmicas citadas, que se baseiam nos três benchmarks descritos acima
. Portanto, trate esse número com cautela redobrada.
Muitos frameworks de agentes melhoram apenas o scaffold: você ajusta prompts, muda a ordem das ferramentas, insere exemplos. O SIA vai além. O artigo mostra que combinar atualizações de scaffold com atualizações de pesos gera resultados consistentemente melhores do que mexer só no scaffold . É essa combinação de alavancas que sustenta a principal reivindicação de novidade do trabalho.
O Hermes Agent, da Nous Research, é outro agente de código aberto que aprende com a experiência — mas por um caminho diferente. A documentação do Hermes descreve um ciclo de aprendizado que cria habilidades (skills) a partir de tarefas bem-sucedidas, armazena conhecimento de forma persistente e constrói um modelo cada vez mais profundo do usuário ao longo das sessões . Ele foca em reutilização e acumulação de experiência.
Já o SIA opera num nível mais baixo: em vez de criar bibliotecas de habilidades, ele reescreve ativamente o scaffold e altera os pesos do modelo para se tornar melhor naquela tarefa específica . São filosofias diferentes: o Hermes aprende com você e acumula habilidades; o SIA aprende por si mesmo e modifica sua própria estrutura interna para performar melhor.
O Hexo Labs liberou o SIA sob licença MIT e com código aberto, convidando a comunidade acadêmica e de desenvolvedores a testar, criticar e estender o framework . O laboratório também anunciou parcerias com universidades e um programa de grants para fornecer acesso a capital, infraestrutura e colaboração direta com a equipe do Hexo Labs
. O objetivo declarado é claro: acelerar a pesquisa em sistemas de IA capazes de se autoaperfeiçoar, mas com transparência e abertura como salvaguardas
.
Se o SIA vai cumprir a promessa de ser um degrau real rumo à superinteligência, ainda é cedo para afirmar. Mas uma coisa é certa: a ideia de um sistema que não só executa, mas que também se reescreve e se recalibra sozinho, marca um capítulo novo na conversa sobre agentes autônomos.
Comments
0 comments