Per punti dati più semplici come anno di pubblicazione, paese o numero di partecipanti, l'IA funziona bene. Fa più fatica con dati complessi come descrizioni di risultati o dettagli sugli interventi .
In un progetto clinico reale, l'estrazione automatizzata basata sull'IA da documenti PDF ha portato a un aumento di velocità di 500 volte rispetto all'estrazione manuale, con risultati più precisi e una significativa riduzione dello sforzo manuale . Ciò ha comportato l'addestramento di un modello linguistico pre-addestrato specifico per dominio per riconoscere 20 entità rilevanti (ad esempio, nome del farmaco, date di inizio e fine dello studio)
.
Il recupero della struttura delle tabelle è un punto debole importante. Un benchmark su 200 documenti reali ha rilevato che i parser PDF di base hanno ottenuto un punteggio di 0,000 nel recupero della struttura delle tabelle — il testo viene estratto, ma le relazioni riga-colonna vengono perse . I layout complessi, i PDF scansionati senza livelli di testo adeguati e i documenti a più colonne causano la maggior parte degli errori. Senza il contesto del layout, gli LLM possono allucinare valori o produrre omissioni, classificazioni errate ed errori fattuali
.
Altre sfide persistenti includono la rigidità dei metodi basati su regole e la mancanza di dataset annotati specifici per dominio per addestrare approcci basati sull'apprendimento .
Diversi strumenti di IA ora mirano specificamente al flusso di lavoro delle revisioni sistematiche e delle meta-analisi:
L'IA può estrarre dati, metodologia e risultati da studi in PDF con una precisione utile e una velocità trasformativa. Ma non è ancora abbastanza affidabile da sostituire la revisione umana per applicazioni critiche come le sottomissioni normative o le tabelle finali di revisione sistematica — specialmente quando sono coinvolte tabelle e layout complessi. La validazione umana dei dati estratti dall'IA rimane la pratica raccomandata per i casi d'uso critici .
Comments
0 comments