AI agenti selhávají v základní biologii: Problém je v datovém potrubí
Přelomová studie Anthropicu, NCBI, Broad Institute a Chan Zuckerberg Initiative zjistila, že špičkové modely AI katastrofálně selhávají při získávání sekvenčních dat virů, s přesností až 16,9 %, protože veřejné biolog... Základním problémem je absence deterministických, reprodukovatelných rozhraní v biologické datov...
What do researchers from Anthropic, NCBI, the Broad Institute, and the Chan Zuckerberg Initiative reveal about why AI agents fail at retrievThe gap between AI and biology is not a failure of intelligence but of infrastructure — a lesson made clear by new research from Anthropic and leading scientific institutions.
AI Prompt
Create a landscape editorial hero image for this Studio Global article: What do researchers from Anthropic, NCBI, the Broad Institute, and the Chan Zuckerberg Initiative reveal about why AI agents fail at retriev. Article summary: In a collaboration between Anthropic, NCBI, the Broad Institute, and the Chan Zuckerberg Initiative (CZI), researchers demonstrated that state-of-the-art AI agents fail at retrieving biological data from public databases. Topic tags: general, government, academic, general web, user generated. Reference image context from search candidates: Reference image 1: visual subject "# Artificial Intelligence agents for biological research: a survey. A **.gov** website belongs to an official government organization in the United States. Inclusion in an NLM data" source context "Artificial Intelligence agents for biological research: a survey - PMC" Reference image 2: vis
openai.com
Přelomová spolupráce mezi společností Anthropic, Národním centrem pro biotechnologické informace (NCBI), Broad Institute a iniciativou Chan Zuckerberg Initiative (CZI) odhalila špinavé tajemství vědy řízené umělou inteligencí: dnešní nejvýkonnější AI agenti jsou naprosto nespolehliví pro tak triviální úkol, jako je získání sekvencí virové DNA z veřejné databáze. Výzkum publikovaný v červnu 2026 zjistil, že modely jako Claude Sonnet 4 dosáhly při této rutinní úloze přesnosti pouhých 16,9 %. Viníkem však není inteligence AI – ale „potrubí“. Infrastruktura byla navržena pro lidi klikající ve webových formulářích, ne pro autonomní agenty. Vytvořením deterministické vyhledávací vrstvy nazvané gget virus tým dosáhl téměř 100% přesnosti, čímž dokázal, že oprava datových trubek je nejrychlejší cestou k důvěryhodné biologii s AI .
Proč AI agenti v biologických databázích narážejí
Laura Luebbert a její kolegové problém přiblížili silnou analogií: použití AI agenta pro navigaci v biologických datech je jako řídit moderní auto středověkým městem. Auto je technicky vyspělé, ale silnice pro něj nikdy nebyly navrženy .
Spolupráce testovala několik předních AI systémů – Claude, modely založené na GPT, Biomni Open Source a Edison Analysis – na zdánlivě jednoduchém úkolu: získat sekvenční data virů z databáze NCBI Virus, což je klíčový zdroj pro virology sledující ohniska nákaz a vyvíjející diagnostiku . Výsledky byly alarmující.
Studio Global AI
Search, cite, and publish your own answer
Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.
What is the short answer to "AI agenti selhávají v základní biologii: Problém je v datovém potrubí"?
Přelomová studie Anthropicu, NCBI, Broad Institute a Chan Zuckerberg Initiative zjistila, že špičkové modely AI katastrofálně selhávají při získávání sekvenčních dat virů, s přesností až 16,9 %, protože veřejné biolog...
What are the key points to validate first?
Přelomová studie Anthropicu, NCBI, Broad Institute a Chan Zuckerberg Initiative zjistila, že špičkové modely AI katastrofálně selhávají při získávání sekvenčních dat virů, s přesností až 16,9 %, protože veřejné biolog... Základním problémem je absence deterministických, reprodukovatelných rozhraní v biologické datové infrastruktuře – to nutí agenty AI procházet nekonzistentní webové formuláře a způsobuje, že stejný dotaz vrátí pokaždé...
What should I do next in practice?
Důsledky sahají daleko za virologii: tým tvrdí, že více než 30 databází NCBI potřebuje přestavbu pro agenty a CZI prosazuje federovaná data v měřítku AI, která by poháněla novou generaci výpočetní biologie.
Design pro lidi, výkon pro agenty až na posledním místě
Databáze NCBI Virus a mnoho dalších veřejných biologických databází byly postaveny pro interaktivní pracovní postupy v prohlížeči. Vědci klikají na filtry, ručně kontrolují výsledky a spoléhají na vizuální podněty. Tato logika rozhraní je nekompatibilní s autonomními agenty, kteří očekávají strukturované, programovatelné příkazy .
Radikálně nedeterministické výsledky
Nejvíce odsuzujícím zjištěním byla nekonzistence. Když výzkumníci třikrát požádali model Claude Sonnet 4, aby získal sekvence viru Ebola oproti ověřené základní pravdě 266 záznamů, při prvním pokusu jich vrátil 106, při druhém 15 a při třetím jen 5. Žádné prompty se nezměnily – pouze výstup .
Tady nejde jen o chybějící záznamy. V jedné simulaci chybné vyhledávání zkreslilo fylogenetickou analýzu natolik, že odhadla původ ohniska Eboly na rok 1922 namísto správného data 2014. AI si vědu nevyhalucinovala – byl jí podstrčen nekompletní dataset a ona na něm svědomitě postavila falešný závěr .
Křehká, fragmentovaná infrastruktura
Biologická data jsou roztroušena v desítkách databází s nekompatibilními identifikátory, různými standardy metadat a bez verzovaných API. Softwaroví inženýři spoléhají na správce balíčků a verzované koncové body; výpočetní biologové jsou často nuceni skriptovat proti nekonzistentním webovým rozhraním, která se mění bez ohlášení .
Deterministické řešení: gget virus
Namísto trénování lepšího modelu tým postavil lepší vyhledávací vrstvu. gget virus je odlehčený, deterministický framework, který formalizuje logiku filtrování NCBI Virus do reprodukovatelného programového systému .
Funguje tak, že před stažením sekvencí aplikuje omezení metadat, selektivně získává pouze ty strukturované záznamy GenBank, které odpovídají kritériím, a snižuje objem přenesených dat o více než 98 % u velkoobjemových dotazů, přičemž zachovává sémantiku přesné shody. Výsledkem je pokaždé stejný dataset – vlastnost, kterou AI agenti zoufale potřebují, ale stará infrastruktura ji nemohla poskytnout .
Dopad byl okamžitý a dramatický. Když autonomní AI systémy používaly gget virus jako svůj backend pro vyhledávání:
Přesnost vyskočila na nejméně 90,0 % pro všechny testované modely, přičemž GPT-5.5 dosáhl 99,7 %.
Metriky stability vzrostly napříč spektrem na 0,92–1,00.
Míra chyb, zejména těch katastrofických, které mění vědecké závěry, se dramaticky snížila .
Poselství je jednoznačné: omezujícím faktorem pro biologii poháněnou AI není uvažování modelů – je to deterministický přístup k datům. Přidejte správnou vyhledávací vrstvu a dnešní agenti již mohou odvádět spolehlivou práci .
Přehodnocení biologické datové infrastruktury pro éru agentů
Úspěch nástroje gget virus je důkazem konceptu pro mnohem větší posun. Výzkumníci tvrdí, že tento vzorec se neomezuje pouze na virologii – jen NCBI hostí přes 30 databází, které by měly prospěch z podobných deterministických obalů .
Od designu pro lidi k designu nativnímu pro agenty
Biologické databáze se musí vyvinout tak, aby vystavovaly dobře zdokumentovaná, verzovaná API se standardizovaným filtrováním a reprodukovatelnou sémantikou dotazů. To je ekvivalent toho, co vývojáři softwaru získávají od správců balíčků a systémů pro správu verzí – kritická infrastruktura, která biologické vědě v současnosti chybí .
Tlak na federovaná data v měřítku AI
V paralelní snaze zveřejnila Chan Zuckerberg Initiative plán, který požaduje interoperabilní, sdružené biologické datasety, jež lze dotazovat prostřednictvím rozhraní příkazového řádku a strojově čitelných standardů. Jejich vize: svět, kde vědci mohou vyhledávat, analyzovat a stahovat multimodální data v jediném federovaném dotazu, což umožní objevy v měřítku AI bez současného chaosu při vyhledávání .
CZI již v tomto směru jedná, vyvíjí CLI pro federovaný přístup k datům a buduje Projekt miliardy buněk (Billion Cells Project), přelomový dataset jednotlivých buněk určený k trénování modelů AI nové generace. Cílem je základní infrastruktura, která učiní biologická data pro stroje stejně přístupná, jako jsou repozitáře kódu pro vývojáře .
Poučení se neomezuje jen na biologii
Základní poznatek – že starší rozhraní navržená pro lidi narušují AI agenty – se zobecňuje napříč vědeckými výpočty. Deterministické, programovatelné přístupové vrstvy nejsou luxus; jsou nezbytným předpokladem pro to, aby se autonomní systémy mohly spolehlivě účastnit výzkumu. Řešením není čekat na chytřejší model. Je jím modernizace silnic.
arxiv.org[PDF] A path towards AI-scale, interoperable biological data - arXiv
Comments
0 comments