בפרויקט מחקר קליני אמיתי, חילוץ אוטומטי מונחה AI ממסמכי PDF הביא לעלייה של פי 500 במהירות בהשוואה לחילוץ ידני, יחד עם תוצאות מדויקות יותר והפחתה משמעותית במאמץ הידני . זה כלל אימון של מודל שפה מאומן מראש ספציפי לתחום לזיהוי 20 ישויות רלוונטיות (למשל, שם תרופה, תאריכי התחלה וסיום של ניסוי)
.
שחזור מבנה טבלאות הוא חולשה משמעותית. מדד על 200 מסמכים אמיתיים מצא שנתחי PDF בסיסיים קיבלו ציון 0.000 בשחזור מבנה טבלאות — הטקסט נשלף החוצה, אבל יחסי השורות והעמודות אבדו . פריסות מורכבות, קובצי PDF סרוקים ללא שכבת טקסט מתאימה, ומסמכים מרובי עמודות גורמים לרוב השגיאות. ללא הקשר פריסה, מודלי שפה עלולים להזות ערכים או לייצר השמטות, סיווגים שגויים ושגיאות עובדתיות
.
אתגרים מתמשכים נוספים כוללים את הנוקשות של שיטות מבוססות כללים ואת היעדר מערכי נתונים ספציפיים לתחום מתויגים לאימון גישות מבוססות למידה .
מספר כלי AI מכוונים כיום ספציפית לזרימת העבודה של סקירות שיטתיות ומטא-אנליזה:
AI יכול לחלץ נתונים, מתודולוגיה ותוצאות ממחקרי PDF בדיוק שימושי ובמהירות מהפכנית. אבל הוא עדיין לא אמין מספיק כדי להחליף ביקורת אנושית ביישומים קריטיים כמו הגשות רגולטוריות או טבלאות נתונים סופיות של סקירות שיטתיות — במיוחד כאשר מעורבות טבלאות ופריסות מורכבות. אימות אנושי של נתונים שחולצו על ידי AI נותר הנוהג המומלץ לשימושים קריטיים .
Comments
0 comments