AnswersPublished4 days agoLast edited 4 days ago19 sources

סוכני בינה מלאכותית נכשלים במשימה ביולוגית פשוטה: המשבר בתשתית הנתונים

מחקר תקדימי של Anthropic, NCBI, מכון Broad ויוזמת צ'אן צוקרברג מצא שמודלי הבינה המלאכותית המובילים נכשלים באופן קטסטרופלי בשליפת מידע על רצפים ויראליים, עם דיוק של עד 16.9% בלבד, מכיוון שהמאגרים הציבוריים תוכננו לבני... הבעיה הבסיסית היא שלתשתית הנתונים הביולוגיים חסרים ממשקים דטרמיניסטיים וניתנים לשחזור – מה שמאלץ...

Search & fact-check with Studio Global AI Browse more Trending pages

140K0

Abstract illustration of a DNA helix intersecting with digital circuitry and database nodes, symbolizing the infrastructure gap between AI and biological data. — What do researchers from Anthropic, NCBI, the Broad Institute, and the Chan Zuckerberg Initiative reveal about why AI agents fail at retrievThe gap between AI and biology is not a failure of intelligence but of infrastructure — a lesson made clear by new research from Anthropic and leading scientific institutions.
AI Prompt
Create a landscape editorial hero image for this Studio Global article: What do researchers from Anthropic, NCBI, the Broad Institute, and the Chan Zuckerberg Initiative reveal about why AI agents fail at retriev. Article summary: In a collaboration between Anthropic, NCBI, the Broad Institute, and the Chan Zuckerberg Initiative (CZI), researchers demonstrated that state-of-the-art AI agents fail at retrieving biological data from public databases. Topic tags: general, government, academic, general web, user generated. Reference image context from search candidates: Reference image 1: visual subject "# Artificial Intelligence agents for biological research: a survey. A **.gov** website belongs to an official government organization in the United States. Inclusion in an NLM data" source context "Artificial Intelligence agents for biological research: a survey - PMC" Reference image 2: vis
openai.com

שיתוף פעולה יוצא דופן בין חברת Anthropic, המרכז הלאומי למידע ביוטכנולוגי (NCBI), מכון Broad ויוזמת צ'אן צוקרברג (CZI) חשף את הסוד המלוכלך של המדע מונחה הבינה המלאכותית: סוכני הבינה המלאכותית החזקים ביותר כיום אינם אמינים לחלוטין במשימה פשוטה כמו שליפת רצפי DNA נגיפיים ממאגר נתונים ציבורי. המחקר, שפורסם ביוני 2026, מצא שמודלים כמו Claude Sonnet 4 השיגו דיוק של 16.9% בלבד במשימה השגרתית הזו .

אבל האשם אינו האינטליגנציה של המכונה – זו הצנרת. התשתית תוכננה עבור מדענים שלוחצים על טפסים בדפדפן, לא עבור סוכנים אוטונומיים. על ידי בניית שכבת שליפה דטרמיניסטית בשם gget virus, הצוות הגיע לכמעט 100% דיוק באופן מיידי, והוכיח ששיפור הצינורות הוא הדרך המהירה ביותר לביולוגיה חישובית אמינה .

למה סוכני בינה מלאכותית מתרסקים על מאגרי נתונים ביולוגיים

החוקרת לורה ליברט ועמיתיה הציגו את הבעיה באנלוגיה עוצמתית: השימוש בסוכן בינה מלאכותית לניווט בנתונים ביולוגיים הוא כמו לנהוג במכונית מודרנית בעיר מימי הביניים. המכונית עצמה מתקדמת טכנולוגית, אבל הכבישים מעולם לא תוכננו עבורה .

שיתוף הפעולה בחן כמה ממערכות הבינה המלאכותית המובילות – Claude, מודלים מבוססי GPT, Biomni Open Source ו-Edison Analysis – במשימה הפשוטה לכאורה של שליפת נתוני רצפים נגיפיים מ-, משאב מרכזי עבור וירולוגים העוקבים אחר התפרצויות ומפתחים כלי אבחון . התוצאות היו מדאיגות.

Studio Global AI

Search, cite, and publish your own answer

Use this topic as a starting point for a fresh source-backed answer, then compare citations before you share it.

סוכני בינה מלאכותית נכשלים במשימה ביולוגית פשוטה: המשבר בתשתית הנתונים

למה סוכני בינה מלאכותית מתרסקים על מאגרי נתונים ביולוגיים

Search, cite, and publish your own answer

People also ask

What is the short answer to "סוכני בינה מלאכותית נכשלים במשימה ביולוגית פשוטה: המשבר בתשתית הנתונים"?

What are the key points to validate first?

What should I do next in practice?

Sources

Comments

עיצוב לבני אדם, ביצועים גרועים לסוכנים

תוצאות לא דטרמיניסטיות באופן קיצוני

תשתית מקוטעת ושברירית

הפתרון הדטרמיניסטי: gget virus

לחשוב מחדש על תשתית הנתונים הביולוגיים לעידן הסוכנים

מעיצוב ממוקד-אדם לעיצוב מותאם-סוכן

הדחיפה לנתונים מאוחדים בקנה מידה של בינה מלאכותית

הלקח אינו מוגבל לביולוגיה