Anthropicin, NCBI:n, Broad Instituten ja Chan Zuckerberg Initiativen tutkimus paljasti, että huippuluokan tekoälymallit epäonnistuvat katastrofaalisesti virusten DNA sekvenssien haussa, tarkkuuden ollessa jopa vain 16... Ongelma ei ole tekoälyn päättelykyvyssä, vaan vanhanaikaisessa dataputkistossa: sama kysely voi...
What do researchers from Anthropic, NCBI, the Broad Institute, and the Chan Zuckerberg Initiative reveal about why AI agents fail at retrievThe gap between AI and biology is not a failure of intelligence but of infrastructure — a lesson made clear by new research from Anthropic and leading scientific institutions.
AI Prompt
Create a landscape editorial hero image for this Studio Global article: What do researchers from Anthropic, NCBI, the Broad Institute, and the Chan Zuckerberg Initiative reveal about why AI agents fail at retriev. Article summary: In a collaboration between Anthropic, NCBI, the Broad Institute, and the Chan Zuckerberg Initiative (CZI), researchers demonstrated that state-of-the-art AI agents fail at retrieving biological data from public databases. Topic tags: general, government, academic, general web, user generated. Reference image context from search candidates: Reference image 1: visual subject "# Artificial Intelligence agents for biological research: a survey. A **.gov** website belongs to an official government organization in the United States. Inclusion in an NLM data" source context "Artificial Intelligence agents for biological research: a survey - PMC" Reference image 2: vis
openai.com
Anthropicin, NCBI:n, Broad Instituten ja Chan Zuckerberg Initiativen (CZI) välinen yhteistyötutkimus on paljastanut likaisen salaisuuden tekoälyavusteisesta tieteestä: nykypäivän tehokkaimmat tekoälyagentit ovat täysin epäluotettavia niinkin yksinkertaisessa tehtävässä kuin viruksen DNA-sekvenssien hakemisessa julkisesta tietokannasta. Kesäkuussa 2026 julkaistussa tutkimuksessa havaittiin, että esimerkiksi Claude Sonnet 4 -mallin tarkkuus tässä rutiinitehtävässä oli vain 16,9 %. Mutta syyllinen ei ole tekoälyn älykkyys – vaan putkisto. Infrastruktuuri on suunniteltu ihmisille, jotka napsuttelevat verkkolomakkeita, ei autonomisille agenteille. Rakentamalla deterministisen hakukerroksen nimeltä gget virus tutkijaryhmä saavutti lähes 100 % tarkkuuden välittömästi, todistaen että dataputkien korjaaminen on nopein tie luotettavaan tekoälybiologiaan .
Miksi tekoälyagentit kaatuvat biologisiin tietokantoihin
Laura Luebbert ja hänen kollegansa tiivistivät ongelman osuvaan analogiaan: tekoälyagentin käyttö biologisen datan parissa on kuin ajaisi modernia autoa keskiaikaisessa kaupungissa. Auto on teknisesti edistynyt, mutta tietä ei ole koskaan suunniteltu sille .
Yhteistyössä testattiin useita johtavia tekoälyjärjestelmiä – Claudea, GPT-pohjaisia malleja, Biomni Open Sourcea ja Edison Analysisia – näennäisen suoraviivaisessa tehtävässä: virussekvenssidatan hakemisessa NCBI Virus -tietokannasta, joka on virologien keskeinen resurssi epidemioiden seurantaan ja diagnostiikan kehitykseen . Tulokset olivat hälyttäviä.
Studio Global AI
Search, cite, and publish your own answer
Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.
What is the short answer to "Tekoälyagentit kompastuvat biologian perusteisiin: dataputkiston kriisi"?
Anthropicin, NCBI:n, Broad Instituten ja Chan Zuckerberg Initiativen tutkimus paljasti, että huippuluokan tekoälymallit epäonnistuvat katastrofaalisesti virusten DNA sekvenssien haussa, tarkkuuden ollessa jopa vain 16...
What are the key points to validate first?
Anthropicin, NCBI:n, Broad Instituten ja Chan Zuckerberg Initiativen tutkimus paljasti, että huippuluokan tekoälymallit epäonnistuvat katastrofaalisesti virusten DNA sekvenssien haussa, tarkkuuden ollessa jopa vain 16... Ongelma ei ole tekoälyn päättelykyvyssä, vaan vanhanaikaisessa dataputkistossa: sama kysely voi palauttaa täysin eri tuloksia eri kerroilla, mikä voi johtaa vääriin tieteellisiin johtopäätöksiin, kuten Ebola taudin al...
What should I do next in practice?
Tutkijoiden kehittämä deterministinen gget virus hakukerros nosti tekoälyagenttien tarkkuuden lähes 100 prosenttiin, todistaen, että tieteen datainfrastruktuurin on uudistuttava 'agenttinatiiviksi', jotta tekoälyä voi...
NCBI Virus ja monet muut julkiset biologiset tietokannat on rakennettu interaktiivista, selainpohjaista käyttöä varten. Tutkijat klikkailevat suodattimia, tarkistavat tuloksia manuaalisesti ja luottavat visuaalisiin vihjeisiin. Tämä käyttöliittymälogiikka on täysin yhteensopimaton autonomisten agenttien kanssa, jotka odottavat strukturoituja, ohjelmallisia komentoja .
Radikaalisti epädeterministiset tulokset
Tuomittavin löydös oli epäjohdonmukaisuus. Kun tutkijat pyysivät Claude Sonnet 4:ää kolme kertaa hakemaan Ebola-viruksen sekvenssejä todennettua 266 osuman vertailuaineistoa vasten, se palautti ensimmäisellä kerralla 106, toisella 15 ja kolmannella vain 5 sekvenssiä. Mikään kyselyssä ei muuttunut – vain lopputulos .
Kyse ei ole vain muutamasta puuttuvasta tietueesta. Eräässä simulaatiossa virheellinen haku vääristi fylogeneettisen analyysin niin pahoin, että se arvioi Ebola-epidemian alkuperän vuoteen 1922 oikean vuoden 2014 sijaan. Tekoäly ei hallusinoinut tiedettä – se oli syötetty rikkinäisellä aineistolla ja rakensi sen päälle totuudenmukaisesti väärän johtopäätöksen .
Hauras ja hajanainen infrastruktuuri
Biologinen data on hajallaan kymmenissä tietokannoissa, joissa on yhteensopimattomat tunnisteet, erilaiset metadatastandardit eikä versiohallittuja ohjelmointirajapintoja. Ohjelmistoinsinöörit luottavat pakettienhallintaan ja versioituihin rajapintoihin; laskennalliset biologit joutuvat usein skriptaamaan epäjohdonmukaisia verkkokäyttöliittymiä vasten, jotka muuttuvat ilman varoitusta .
Deterministinen korjaus: gget virus
Sen sijaan, että olisi koulutettu parempaa mallia, tiimi rakensi paremman hakukerroksen. gget virus on kevyt, deterministinen kehys, joka formalisoi NCBI Viruksen suodatuslogiikan toistettavaksi ohjelmalliseksi järjestelmäksi .
Se toimii soveltamalla metadatavaatimuksia ennen sekvenssien lataamista, noukkimalla valikoidusti vain täsmälliset GenBank-tietueet, ja vähentäen tiedonsiirtoa yli 98 % suurivolyymisissa kyselyissä säilyttäen täydellisen vastaavuuden. Lopputulos on sama aineisto joka kerta – ominaisuus, jota tekoälyagentit epätoivoisesti tarvitsevat, mutta jota vanha infrastruktuuri ei kyennyt tarjoamaan .
Vaikutus oli välitön ja dramaattinen. Kun autonomiset tekoälyjärjestelmät käyttivät gget virusta hakuarkkitehtuurinaan:
Kaikkien testattujen mallien tarkkuus nousi vähintään 90,0 prosenttiin, ja GPT-5.5 saavutti jopa 99,7 prosentin tarkkuuden.
Vakausmittarit nousivat 0,92–1,00 asteikolla kautta linjan.
Virheiden suuruus, erityisesti katastrofaalisten, tieteellisiä johtopäätöksiä muuttavien virheiden, romahti .
Johtopäätös on yksiselitteinen: tekoälyavusteisen biologian pullonkaula ei ole mallien päättelykyky – vaan deterministinen datan saanti. Kun oikea hakukerros lisätään, nykyiset agentit voivat jo tehdä luotettavaa työtä .
gget viruksen menestystarina on todiste paljon laajemmasta murroksesta. Tutkijat argumentoivat, että tämä malli ei rajoitu virologiaan – pelkästään NCBI:llä on yli 30 tietokantaa, jotka hyötyisivät vastaavista deterministisistä kääreistä .
Ihmiskeskeisestä agenttinatiiviajatteluun
Biologisten tietokantojen on kehityttävä tarjoamaan hyvin dokumentoituja, versiohallittuja ohjelmointirajapintoja, joissa on standardoitu suodatus ja toistettavat kyselysemantiikat. Tämä vastaa sitä, mitä ohjelmistokehittäjät saavat pakettienhallinnasta ja versionhallintajärjestelmistä – kriittistä infrastruktuuria, jota biotieteiltä tällä hetkellä puuttuu .
Kohti yhdistettyä, tekoälyskaalan dataa
Rinnakkaistyössä Chan Zuckerberg Initiative julkaisi tiekartan, jossa vaaditaan yhteentoimivia, yhdistettyjä biologisia aineistoja, joita voidaan kysellä komentorivikäyttöliittymillä ja koneellisesti luettavilla standardeilla. Heidän visionsa: maailma, jossa tutkijat voivat etsiä, analysoida ja ladata monimuotoista dataa yhdellä yhdistetyllä kyselyllä, mahdollistaen tekoälyskaalan löydöt ilman nykyistä hakukaosta .
CZI toteuttaa tätä jo, kehittämällä komentorivityökalua yhdistettyyn datan saatavuuteen ja rakentamalla Billion Cells Project -projektia, joka on valtava yksisoluaineisto seuraavan sukupolven tekoälymallien kouluttamiseen. Tavoitteena on perustavanlaatuinen infrastruktuuri, joka tekee biologisesta datasta yhtä helposti koneiden saavutettavissa kuin koodivarannot ovat kehittäjille .
Opetus ei rajoitu biologiaan
Keskeinen oivallus – että vanhat ihmiskeskeiset rajapinnat särkevät tekoälyagentit – yleistyy koko tieteellisen laskennan alalle. Deterministiset, ohjelmalliset hakukerrokset eivät ole ylellisyys; ne ovat edellytys sille, että autonomiset järjestelmät voivat osallistua tutkimukseen luotettavasti. Korjaus ei ole älykkäämmän mallin odottaminen. Se on teiden parantaminen.
arxiv.org[PDF] A path towards AI-scale, interoperable biological data - arXiv
Comments
0 comments