W przypadku prostszych punktów danych, takich jak rok publikacji, kraj czy liczba uczestników, AI radzi sobie dobrze. Trudności pojawiają się przy bardziej złożonych danych, takich jak opisy wyników czy szczegóły interwencji .
W rzeczywistym projekcie badań klinicznych automatyczna ekstrakcja danych z dokumentów PDF przy użyciu AI przyniosła 500-krotny wzrost szybkości w porównaniu z ekstrakcją ręczną, a także bardziej precyzyjne wyniki i znaczną redukcję nakładu pracy ręcznej . Osiągnięto to poprzez trenowanie domenowego, wstępnie wytrenowanego modelu językowego do rozpoznawania 20 istotnych bytów (np. nazwa leku, daty rozpoczęcia i zakończenia badania)
.
Odtwarzanie struktury tabel to główna słabość. Test porównawczy na 200 prawdziwych dokumentach wykazał, że podstawowe parsery PDF uzyskały wynik 0.000 w odtwarzaniu struktury tabel – tekst jest wyciągany, ale relacje między wierszami a kolumnami są tracone . Złożone układy, skanowane PDF-y bez odpowiedniej warstwy tekstowej i dokumenty wielokolumnowe powodują najwięcej błędów. Bez kontekstu układu strony modele LLM mogą halucynować wartości lub generować pominięcia, błędne klasyfikacje i błędy merytoryczne
.
Inne trwałe wyzwania to sztywność metod opartych na regułach oraz brak adnotowanych zestawów danych specyficznych dla danej dziedziny do uczenia podejść opartych na uczeniu .
Kilka narzędzi AI jest obecnie ukierunkowanych konkretnie na przepływ pracy w przeglądach systematycznych i metaanalizach:
AI może wyodrębniać dane, metodologię i wyniki z plików PDF badań z użyteczną dokładnością i rewolucyjną szybkością. Nie jest jednak jeszcze na tyle niezawodna, aby zastąpić recenzję człowieka w krytycznych zastosowaniach, takich jak zgłoszenia regulacyjne czy końcowe tabele danych w przeglądach systematycznych – zwłaszcza gdy w grę wchodzą tabele i złożone układy. Walidacja danych wyodrębnionych przez AI przez człowieka pozostaje zalecaną praktyką w zastosowaniach krytycznych .
Comments
0 comments