Yapay Zeka Ajanları Temel Biyolojide Başarısız: Veri Altyapı Krizi
Anthropic, NCBI, Broad Institute ve Chan Zuckerberg Initiative'ın ortak araştırması, en iyi yapay zeka modellerinin virüs dizilimi verilerini çekmede feci şekilde başarısız olduğunu, doğruluk oranının %16,9'a kadar dü... Temel sorun, biyolojik veri altyapısının deterministik ve tekrarlanabilir arayüzlerden yoksun ol...
What do researchers from Anthropic, NCBI, the Broad Institute, and the Chan Zuckerberg Initiative reveal about why AI agents fail at retrievThe gap between AI and biology is not a failure of intelligence but of infrastructure — a lesson made clear by new research from Anthropic and leading scientific institutions.
AI Prompt
Create a landscape editorial hero image for this Studio Global article: What do researchers from Anthropic, NCBI, the Broad Institute, and the Chan Zuckerberg Initiative reveal about why AI agents fail at retriev. Article summary: In a collaboration between Anthropic, NCBI, the Broad Institute, and the Chan Zuckerberg Initiative (CZI), researchers demonstrated that state-of-the-art AI agents fail at retrieving biological data from public databases. Topic tags: general, government, academic, general web, user generated. Reference image context from search candidates: Reference image 1: visual subject "# Artificial Intelligence agents for biological research: a survey. A **.gov** website belongs to an official government organization in the United States. Inclusion in an NLM data" source context "Artificial Intelligence agents for biological research: a survey - PMC" Reference image 2: vis
openai.com
Anthropic, NCBI (Ulusal Biyoteknoloji Bilgi Merkezi), Broad Institute ve Chan Zuckerberg Girişimi (CZI) arasındaki büyük bir iş birliği, yapay zeka destekli bilimin kirli bir sırrını ifşa etti: Günümüzün en güçlü yapay zeka ajanları, halka açık bir veri tabanından viral DNA dizilimleri çekmek gibi basit bir görev için bile tamamen güvenilmez. Haziran 2026'da yayınlanan araştırma, Claude Sonnet 4 gibi modellerin bu rutin işte %16,9 gibi düşük bir doğruluk oranına ulaştığını ortaya koydu. Ancak suçlu yapay zekanın zekası değil, dijital 'sıhhi tesisat'. Altyapı, otonom ajanlar için değil, web formlarını tıklayan insanlar için tasarlanmıştı. Ekip, gget virus adlı deterministik bir erişim katmanı inşa ederek anında neredeyse %100 doğruluğa ulaştı ve güvenilir bir yapay zeka biyolojisine giden en hızlı yolun veri borularını onarmak olduğunu kanıtladı .
Yapay Zeka Ajanları Biyolojik Veri Tabanlarında Neden Çuvallıyor?
Laura Luebbert ve meslektaşları sorunu güçlü bir benzetmeyle özetledi: Bir yapay zeka ajanını biyolojik verilerde gezinmek için kullanmak, modern bir arabayı orta çağdan kalma bir şehirde sürmeye benzer. Araba teknik olarak gelişmiştir, ancak yollar onun için asla tasarlanmamıştır .
Bu iş birliği, virologların salgınları takip etmek ve teşhis kitleri geliştirmek için başvurduğu NCBI Virus veri tabanından viral dizi verilerini çekmek gibi basit görünen bir görevde, Claude, GPT tabanlı modeller, Biomni Open Source ve Edison Analizi dahil olmak üzere birçok lider yapay zeka sistemini test etti . Sonuçlar endişe vericiydi.
Studio Global AI
Search, cite, and publish your own answer
Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.
What is the short answer to "Yapay Zeka Ajanları Temel Biyolojide Başarısız: Veri Altyapı Krizi"?
Anthropic, NCBI, Broad Institute ve Chan Zuckerberg Initiative'ın ortak araştırması, en iyi yapay zeka modellerinin virüs dizilimi verilerini çekmede feci şekilde başarısız olduğunu, doğruluk oranının %16,9'a kadar dü...
What are the key points to validate first?
Anthropic, NCBI, Broad Institute ve Chan Zuckerberg Initiative'ın ortak araştırması, en iyi yapay zeka modellerinin virüs dizilimi verilerini çekmede feci şekilde başarısız olduğunu, doğruluk oranının %16,9'a kadar dü... Temel sorun, biyolojik veri altyapısının deterministik ve tekrarlanabilir arayüzlerden yoksun olması.
What should I do next in practice?
Etkileri virüslerin çok ötesine uzanıyor: Araştırma ekibi NCBI'ın 30'dan fazla veri tabanının 'ajan doğal' (agent native) olarak yeniden inşa edilmesi gerektiğini savunuyor.
İnsan odaklı tasarım, ajanlar için son sıradaki performans
NCBI Virus ve diğer birçok halka açık biyolojik veri tabanı, etkileşimli, tarayıcı tabanlı iş akışları için inşa edilmiştir. Bilim insanları filtreleri tıklar, sonuçları manuel olarak inceler ve görsel ipuçlarına güvenir. Bu arayüz mantığı, yapılandırılmış, programatik komutlar bekleyen otonom ajanlarla uyumsuzdur .
Radikal biçimde deterministik olmayan sonuçlar
En vahim bulgu tutarsızlıktı. Araştırmacılar Claude Sonnet 4'ten üç kez, doğrulanmış 266 kayıtlık bir gerçek veri setine karşı Ebolavirus dizilimlerini almasını istediğinde, model ilk denemede 106, ikincide 15 ve üçüncüde sadece 5 sonuç döndürdü. Hiçbir istem (prompt) değişmedi, sadece çıktı değişti .
Bu sadece birkaç kaydı kaçırmakla ilgili değil. Bir simülasyonda, hatalı bir veri çekme işlemi, bir filogenetik analizi o kadar çarpıttı ki, bir Ebola salgınının kökenini doğru tarih olan 2014 yerine 1922 olarak tahmin etti. Yapay zeka bilimi halüsinasyon görmemişti; kırık bir veri setiyle beslenmiş ve bunun üzerine uslu uslu yanlış bir sonuç inşa etmişti .
Kırılgan, parçalı altyapı
Biyolojik veriler, uyumsuz tanımlayıcılara, farklı üst veri (metadata) standartlarına ve sürüm kontrollü API'lere sahip olmayan düzinelerce veri tabanına dağılmış durumda. Yazılım mühendisleri paket yöneticilerine ve sürümlü uç noktalara (endpoint) güvenirken, hesaplamalı biyologlar genellikle haber vermeden değişen tutarsız web arayüzlerine karşı betik (script) yazmaya mahkumdur .
Deterministik Çözüm: gget virus
Ekip, daha iyi bir model eğitmek yerine daha iyi bir erişim katmanı inşa etti. gget virus, NCBI Virus'un filtreleme mantığını tekrarlanabilir bir programatik sistem halinde resmileştiren hafif, deterministik bir çerçevedir .
Şu şekilde çalışır: dizilimleri indirmeden önce üst veri kısıtlamaları uygular, yalnızca eşleşen yapılandırılmış GenBank kayıtlarını seçerek getirir ve yüksek hacimli sorgular için veri aktarımını %98'in üzerinde azaltırken tam eşleşme semantiğini korur. Sonuç, her seferinde aynı veri setidir; yapay zeka ajanlarının umutsuzca ihtiyaç duyduğu ancak eski altyapının sağlayamadığı bir özellik .
Etkisi ani ve çarpıcı oldu. Otonom yapay zeka sistemleri, erişim arka ucu olarak gget virus'u kullandığında:
Test edilen tüm modeller için doğruluk en az %90,0'a yükseldi; GPT-5.5 %99,7'ye ulaştı.
Kararlılık metrikleri genel olarak 0,92–1,00 seviyesine çıktı.
Özellikle bilimsel sonuçları değiştiren felaket türündeki hata büyüklüğü çöktü .
Çıkarılacak ders net: Yapay zeka destekli biyoloji üzerindeki kısıtlayıcı bağ model muhakemesi değil, deterministik veri erişimidir. Doğru erişim katmanını ekleyin, bugünün ajanları zaten güvenilir işler yapabilir .
Ajan Çağı İçin Biyolojik Veri Altyapısını Yeniden Düşünmek
gget virus başarı öyküsü, çok daha büyük bir değişim için bir kavram kanıtıdır. Araştırmacılar, bu modelin viroloji ile sınırlı olmadığını, yalnızca NCBI'ın benzer deterministik sarmalayıcılardan (wrapper) fayda görecek 30'dan fazla veri tabanına ev sahipliği yaptığını savunuyor .
İnsan odaklılıktan ajan-doğal tasarıma
Biyolojik veri tabanları, iyi dokümante edilmiş, sürümlü API'leri, standartlaştırılmış filtreleme ve tekrarlanabilir sorgu semantiği ile hizmet verecek şekilde evrimleşmelidir. Bu, yazılım geliştiricilerin paket yöneticilerinden ve sürüm kontrol sistemlerinden aldığına eşdeğerdir; biyolojik bilimlerin şu anda yoksun olduğu kritik bir altyapıdır .
Birleşik, yapay zeka ölçeğinde veri için hamle
Paralel bir çabada, Chan Zuckerberg Girişimi, komut satırı arayüzleri ve makine tarafından okunabilir standartlar aracılığıyla sorgulanabilen, birlikte çalışabilir, bir araya getirilmiş biyolojik veri setleri için bir yol haritası yayınladı. Vizyonları: bilim insanlarının tek bir birleşik sorguda çok modlu verileri arayabileceği, analiz edebileceği ve indirebileceği, mevcut erişim kaosu olmadan yapay zeka ölçeğinde keşif sağlayan bir dünya .
CZI bu konuda şimdiden harekete geçiyor; birleşik veri erişimi için bir CLI (Komut Satırı Arayüzü) geliştiriyor ve yeni nesil yapay zeka modellerini eğitmeyi amaçlayan dönüm noktası niteliğinde bir tek hücre veri seti olan Milyar Hücre Projesi'ni (Billion Cells Project) inşa ediyor. Amaç, biyolojik verileri makineler için, kod depolarının geliştiriciler için olduğu kadar erişilebilir kılan temel bir altyapı oluşturmak .
Ders sadece biyolojiyle sınırlı değil
Temel kavrayış —eski insan-öncelikli arayüzlerin yapay zeka ajanlarını kırdığı— bilimsel hesaplama geneline yayılıyor. Deterministik, programatik erişim katmanları bir lüks değil, otonom sistemlerin araştırmaya güvenilir bir şekilde katılmasını sağlamak için bir ön koşuldur. Çözüm, daha akıllı bir model beklemek değil. Yolları yükseltmek.
arxiv.org[PDF] A path towards AI-scale, interoperable biological data - arXiv
Comments
0 comments