이 구조의 핵심 주장은, 하네스(스캐폴드)만 반복적으로 업데이트하는 기존 방식보다 이 두 가지 수단을 결합하는 것이 테스트된 모든 벤치마크에서 더 우수한 성능을 낸다는 것입니다 . 이는 단순히 프롬프트 엔지니어링을 넘어, AI가 스스로의 ‘두뇌’를 재구성할 수 있는 가능성을 시사합니다.
이번 연구 논문은 SIA의 성능을 입증하기 위해 서로 전혀 다른 세 가지 전문 영역에서 평가를 진행했습니다 . 그 결과, 기존 기준선(baseline) 대비 비약적인 성능 향상이 확인되었습니다.
| 테스트 영역 | 측정 지표 | 주요 결과 |
|---|---|---|
| 중국 법률 혐의 분류 (LawBench) | 정확도 향상 | 기준선 대비 56.6% 개선 |
| GPU 커널 최적화 | 실행 시간 단축 | 기준선 대비 91.9% 실행 시간 감소 |
| 단일 세포 RNA 노이즈 제거 | 성능 향상률 | 기준선 대비 502%의 이득 |
중국 법률 분야에서는 방대한 판례 데이터에서 191개에 달하는 세부 혐의를 분류해야 하는 까다로운 작업에서 인간의 개입 없이 성능을 크게 끌어올렸습니다. GPU 커널 최적화 영역에서는 AI가 스스로 코드를 개선하며 처리 시간을 획기적으로 단축했고, 바이오 분야의 RNA 분석에서도 5배가 넘는 개선을 보여주며 범용성을 입증했습니다. 다만, 공개된 논문에서는 법률 분야의 최종 절대 정확도 수치보다는 향상 폭에 초점을 맞추고 있다는 점에 유의해야 합니다 .
헥소랩스의 공식 발표는 SIA를 ‘초지능 도달을 가속화하는 오픈소스 AI’라고 소개하고 있습니다 . 이 발표에서 언급된 ‘350배 가속’이라는 수치는 저널리즘적 표현으로 보이며, 직접적으로 인용된 학술 자료에서는 앞서 언급한 세 가지 도메인별 구체적인 개선 수치로 뒷받침되고 있습니다
.
헥소랩스는 SIA를 ‘인간의 행동이 아닌 스스로부터 배우는 세계 최초의 에이전트’로 규정합니다 . 연구 논문에서 이 주장의 근거는 하네스와 가중치를 아우르는 이중 업데이트 메커니즘에 있습니다
.
헥소랩스는 SIA의 발전을 위해 대학 및 연구소와 협력하여 프론티어 리서치 그랜트 프로그램(Frontier Research Grants)을 운영하고 있습니다 . 이를 통해 선정된 연구자들에게는 자본금, 대규모 실험을 위한 SIA 인프라 접근권, 그리고 헥소랩스 팀과의 직접적인 협업 기회가 제공됩니다
. 구체적인 지원 금액 규모는 언급되지 않았으나, 이는 오픈소스 기술이 학계의 독립적인 검증과 비판을 거쳐 더욱 건강하게 성장할 수 있도록 하는 생태계 조성의 일환으로 평가됩니다
.
Comments
0 comments