What should I do next in practice?

Løsningen var ikke å trene en smartere modell, men å bygge et deterministisk hentelag kalt «gget virus».

AnswersPublished4 days agoLast edited 4 days ago19 sources

Avsløringen som ryster KI-bransjen: De smarteste modellene bommer totalt på enkle biologioppgaver

En fersk studie fra Anthropic, NCBI, Broad Institute og Chan Zuckerberg Initiative avslører at KI agenter som Claude Sonnet 4 kun oppnår en treffsikkerhet på 16,9 % når de skal hente virale gensekvenser. Inkonsekvensen er skremmende: På tre identiske forsøk på å hente ebolavirus sekvenser returnerte Claude henholdsv...

Search & fact-check with Studio Global AI Browse more Trending pages

140K0

Abstract illustration of a DNA helix intersecting with digital circuitry and database nodes, symbolizing the infrastructure gap between AI and biological data. — What do researchers from Anthropic, NCBI, the Broad Institute, and the Chan Zuckerberg Initiative reveal about why AI agents fail at retrievThe gap between AI and biology is not a failure of intelligence but of infrastructure — a lesson made clear by new research from Anthropic and leading scientific institutions.
AI Prompt
Create a landscape editorial hero image for this Studio Global article: What do researchers from Anthropic, NCBI, the Broad Institute, and the Chan Zuckerberg Initiative reveal about why AI agents fail at retriev. Article summary: In a collaboration between Anthropic, NCBI, the Broad Institute, and the Chan Zuckerberg Initiative (CZI), researchers demonstrated that state-of-the-art AI agents fail at retrieving biological data from public databases. Topic tags: general, government, academic, general web, user generated. Reference image context from search candidates: Reference image 1: visual subject "# Artificial Intelligence agents for biological research: a survey. A **.gov** website belongs to an official government organization in the United States. Inclusion in an NLM data" source context "Artificial Intelligence agents for biological research: a survey - PMC" Reference image 2: vis
openai.com

En banebrytende studie fra Anthropic, NCBI, Broad Institute og Chan Zuckerberg Initiative (CZI) har avdekket en skitten hemmelighet ved KI-drevet vitenskap: Dagens mest avanserte KI-agenter er fullstendig upålitelige for en oppgave så grunnleggende som å hente virale DNA-sekvenser fra en offentlig database. Forskningsarbeidet, publisert i juni 2026, viste at modeller som Claude Sonnet 4 kun oppnådde 16,9 % nøyaktighet på denne rutinejobben. Men synderen er ikke selve KI-en – det er infrastrukturen. Databasene er designet for forskere som klikker seg gjennom nettskjemaer, ikke for autonome agenter. Ved å bygge et deterministisk hentelag kalt gget virus, oppnådde teamet nær 100 % nøyaktighet umiddelbart. Dette beviser at det raskeste veien til pålitelig KI-biologi går gjennom å fikse «rørene» .

Hvorfor KI-agenter feiler på biologiske databaser

Laura Luebbert og kollegene hennes beskrev problemet med en kraftfull analogi: Å bruke en KI-agent til å navigere i biologiske data er som å kjøre en moderne bil gjennom en middelalderby. Bilen er teknisk sofistikert, men veiene ble aldri designet for den .

Samarbeidet testet flere ledende KI-systemer – Claude, GPT-baserte modeller, Biomni Open Source og Edison Analysis – på den tilsynelatende enkle oppgaven med å hente sekvensdata for virus fra NCBI Virus. Dette er en uvurderlig ressurs for virologer som sporer utbrudd og utvikler diagnostiske verktøy . Resultatene var skremmende lesning.

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

Avsløringen som ryster KI-bransjen: De smarteste modellene bommer totalt på enkle biologioppgaver

Hvorfor KI-agenter feiler på biologiske databaser

Search, cite, and publish your own answer

People also ask

What is the short answer to "Avsløringen som ryster KI-bransjen: De smarteste modellene bommer totalt på enkle biologioppgaver"?

What are the key points to validate first?

What should I do next in practice?

Sources

Comments

Designet for mennesker, ubrukelig for agenter

Radikal mangel på reproduserbarhet

Skjør og fragmentert infrastruktur

Den deterministiske løsningen: gget virus

En nytenkning av biologisk datainfrastruktur for agent-tidsalderen

Fra menneskeorientert til agent-tilpasset design

Fremstøtet for forente, KI-skalerte data

Lærdommen er ikke begrenset til biologi