Agenci AI zawodzą na podstawowej biologii: Kryzys hydrauliki danych
Przełomowe badanie Anthropic, NCBI, Broad Institute i Chan Zuckerberg Initiative wykazało, że najlepsze modele AI katastrofalnie zawodzą przy pobieraniu wirusowych sekwencji DNA, osiągając dokładność na poziomie zaled... Sedno problemu tkwi w braku deterministycznych, powtarzalnych interfejsów dostępu do danych biol...
What do researchers from Anthropic, NCBI, the Broad Institute, and the Chan Zuckerberg Initiative reveal about why AI agents fail at retrievThe gap between AI and biology is not a failure of intelligence but of infrastructure — a lesson made clear by new research from Anthropic and leading scientific institutions.
AI Prompt
Create a landscape editorial hero image for this Studio Global article: What do researchers from Anthropic, NCBI, the Broad Institute, and the Chan Zuckerberg Initiative reveal about why AI agents fail at retriev. Article summary: In a collaboration between Anthropic, NCBI, the Broad Institute, and the Chan Zuckerberg Initiative (CZI), researchers demonstrated that state-of-the-art AI agents fail at retrieving biological data from public databases. Topic tags: general, government, academic, general web, user generated. Reference image context from search candidates: Reference image 1: visual subject "# Artificial Intelligence agents for biological research: a survey. A **.gov** website belongs to an official government organization in the United States. Inclusion in an NLM data" source context "Artificial Intelligence agents for biological research: a survey - PMC" Reference image 2: vis
openai.com
Przełomowa współpraca między Anthropic, NCBI, Broad Institute a Chan Zuckerberg Initiative (CZI) obnażyła brudny sekret nauki napędzanej przez AI: dzisiejsi najpotężniejsi agenci AI są kompletnie niewiarygodni przy zadaniu tak prostym, jak pobranie sekwencji wirusowego DNA z publicznej bazy danych. Badanie opublikowane w czerwcu 2026 roku wykazało, że modele takie jak Claude Sonnet 4 osiągnęły dokładność na poziomie zaledwie 16,9% w tym rutynowym zadaniu. Winowajcą nie jest jednak inteligencja AI – to hydraulika. Infrastruktura została zaprojektowana dla ludzi klikających w formularze internetowe, a nie dla autonomicznych agentów. Tworząc deterministyczną warstwę dostępu o nazwie gget virus, zespół niemal natychmiast osiągnął blisko 100% dokładności, udowadniając, że naprawa rur z danymi to najszybsza droga do godnej zaufania AI w biologii .
Dlaczego agenci AI rozbijają się o biologiczne bazy danych
Laura Luebbert i jej koledzy zobrazowali problem za pomocą trafnej analogii: korzystanie z agenta AI do nawigacji po danych biologicznych przypomina jazdę nowoczesnym samochodem po średniowiecznym mieście. Samochód jest zaawansowany technicznie, ale drogi nigdy nie były dla niego projektowane .
Współpraca przetestowała kilka wiodących systemów AI – Claude, modele oparte na GPT, Biomni Open Source i Edison Analysis – w pozornie prostym zadaniu pobrania danych sekwencji wirusowych z bazy NCBI Virus, kluczowego źródła dla wirusologów śledzących ogniska chorób i opracowujących testy diagnostyczne . Wyniki były alarmujące.
Studio Global AI
Search, cite, and publish your own answer
Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.
What is the short answer to "Agenci AI zawodzą na podstawowej biologii: Kryzys hydrauliki danych"?
Przełomowe badanie Anthropic, NCBI, Broad Institute i Chan Zuckerberg Initiative wykazało, że najlepsze modele AI katastrofalnie zawodzą przy pobieraniu wirusowych sekwencji DNA, osiągając dokładność na poziomie zaled...
What are the key points to validate first?
Przełomowe badanie Anthropic, NCBI, Broad Institute i Chan Zuckerberg Initiative wykazało, że najlepsze modele AI katastrofalnie zawodzą przy pobieraniu wirusowych sekwencji DNA, osiągając dokładność na poziomie zaled... Sedno problemu tkwi w braku deterministycznych, powtarzalnych interfejsów dostępu do danych biologicznych – zmusza to agenty AI do nawigacji po niespójnych formularzach internetowych, przez co to samo zapytanie może z...
What should I do next in practice?
Implikacje wykraczają daleko poza wirusologię: zespół postuluje przebudowę ponad 30 baz danych NCBI na potrzeby agentów, a CZI forsuje wizję sfederowanych danych biologicznych o skali AI, by napędzać nową generację bi...
Projektowanie pod kątem człowieka, działanie na niekorzyść agenta
NCBI Virus i wiele innych publicznych baz danych biologicznych zostało zbudowanych z myślą o interaktywnej pracy w przeglądarce. Naukowcy klikają filtry, ręcznie sprawdzają wyniki i polegają na wizualnych wskazówkach. Taka logika interfejsu jest nie do pogodzenia z autonomicznymi agentami, które oczekują ustrukturyzowanych, programowalnych poleceń .
Skrajnie niedeterministyczne wyniki
Najbardziej druzgocącym odkryciem była niekonsekwencja. Gdy badacze trzykrotnie poprosili Claude Sonnet 4 o pobranie sekwencji wirusa Ebola, przy zweryfikowanej referencyjnej liczbie 266, model zwrócił 106 wyników za pierwszym razem, 15 za drugim i tylko 5 za trzecim. Nie zmieniono żadnych poleceń – zmienił się tylko rezultat .
To nie jest tylko kwestia pominięcia kilku rekordów. W jednej z symulacji błędne pobranie danych tak bardzo wypaczyło analizę filogenetyczną, że oszacowała ona początek epidemii Eboli na rok 1922 zamiast na prawidłowy rok 2014. AI nie halucynowała wyników naukowych – została nakarmiona uszkodzonym zestawem danych i sumiennie zbudowała na nim fałszywy wniosek .
Krucha, poszatkowana infrastruktura
Dane biologiczne są rozproszone po dziesiątkach baz z niekompatybilnymi identyfikatorami, różnymi standardami metadanych i brakiem wersjonowanych API. Inżynierowie oprogramowania polegają na menedżerach pakietów i wersjonowanych punktach końcowych; biolodzy obliczeniowi często grzęzną w pisaniu skryptów przeciwko niespójnym interfejsom internetowym, które zmieniają się bez ostrzeżenia .
Deterministyczne rozwiązanie: gget virus
Zamiast trenować lepszy model, zespół zbudował lepszą warstwę dostępu. gget virus to lekki, deterministyczny framework, który formalizuje logikę filtrowania NCBI Virus w powtarzalny, programowalny system .
Działa on poprzez nakładanie ograniczeń na metadane przed pobraniem sekwencji, selektywne pobieranie tylko ustrukturyzowanych rekordów GenBank pasujących do zapytania oraz redukcję transferu danych o ponad 98% dla zapytań o dużej pojemności, zachowując przy tym semantykę dokładnego dopasowania. Rezultatem jest ten sam zestaw danych za każdym razem – właściwość, której agenci AI desperacko potrzebują, ale której stara infrastruktura nie mogła zapewnić .
Wpływ był natychmiastowy i dramatyczny. Gdy autonomiczne systemy AI używały gget virus jako swojego backendu do pobierania danych:
Dokładność wzrosła do co najmniej 90,0% dla wszystkich testowanych modeli, a GPT-5.5 osiągnął 99,7%.
Wskaźniki stabilności wzrosły do przedziału 0,92–1,00.
Skala błędów, szczególnie tych katastrofalnych, które zmieniają wnioski naukowe, gwałtownie spadła .
Wniosek jest jednoznaczny: głównym ograniczeniem dla biologii napędzanej AI nie jest rozumowanie modelu – jest nim deterministyczny dostęp do danych. Dodaj odpowiednią warstwę dostępu, a dzisiejsi agenci mogą już wykonywać wiarygodną pracę .
Nowe myślenie o infrastrukturze danych biologicznych w erze agentów
Sukces gget virus to dowód słuszności koncepcji dla znacznie większej zmiany. Badacze argumentują, że ten wzorzec nie ogranicza się do wirusologii – samo NCBI hostuje ponad 30 baz danych, które skorzystałyby na podobnych deterministycznych interfejsach .
Od projektowania zorientowanego na człowieka do projektowania natywnego dla agentów
Biologiczne bazy danych muszą ewoluować, aby udostępniać dobrze udokumentowane, wersjonowane API ze standaryzowanym filtrowaniem i powtarzalną semantyką zapytań. To odpowiednik tego, co programiści otrzymują od menedżerów pakietów i systemów kontroli wersji – krytyczna infrastruktura, której obecnie brakuje naukom biologicznym .
Dążenie do sfederowanych danych o skali AI
W równoległych działaniach Chan Zuckerberg Initiative opublikowało plan działania wzywający do interoperacyjnych, połączonych zestawów danych biologicznych, które można odpytywać za pomocą interfejsów wiersza poleceń i standardów czytelnych dla maszyn. Ich wizja: świat, w którym naukowcy mogą przeszukiwać, analizować i pobierać dane multimodalne w jednym sfederowanym zapytaniu, umożliwiając odkrycia na skalę AI bez obecnego chaosu związanego z pobieraniem danych .
CZI już działa w tym kierunku, rozwijając interfejs wiersza poleceń (CLI) do sfederowanego dostępu do danych i budując Projekt Miliarda Komórek (Billion Cells Project), przełomowy zestaw danych pojedynczych komórek, mający na celu trenowanie modeli AI nowej generacji. Celem jest fundament infrastruktury, który uczyni dane biologiczne tak dostępnymi dla maszyn, jak repozytoria kodu są dla programistów .
Ta lekcja nie ogranicza się do biologii
Kluczowy wniosek – że przestarzałe interfejsy projektowane dla ludzi psują agenty AI – uogólnia się na całą informatykę naukową. Deterministyczne, programowalne warstwy dostępu nie są luksusem; są warunkiem wstępnym, by systemy autonomiczne mogły wiarygodnie uczestniczyć w badaniach. Rozwiązaniem nie jest czekanie na mądrzejszy model. To modernizacja dróg.
arxiv.org[PDF] A path towards AI-scale, interoperable biological data - arXiv
Comments
0 comments