Untuk titik data yang lebih ringkas seperti tahun penerbitan, negara, atau bilangan peserta, AI berprestasi baik. Ia lebih sukar dengan data kompleks seperti penerangan hasil atau butiran intervensi .
Dalam projek kajian klinikal dunia sebenar, ekstraksi automatik berkuasa AI daripada dokumen PDF menghasilkan peningkatan kelajuan sebanyak 500 kali ganda berbanding ekstraksi manual, bersama dengan hasil yang lebih tepat dan pengurangan ketara dalam usaha manual . Ini melibatkan latihan model bahasa pra-latihan khusus domain untuk mengecam 20 entiti relevan (contohnya, nama ubat, tarikh mula dan tamat percubaan)
.
Pemulihan struktur jadual adalah kelemahan utama. Satu penanda aras ke atas 200 dokumen sebenar mendapati bahawa penghurai PDF asas mendapat skor 0.000 untuk pemulihan struktur jadual — teks berjaya dikeluarkan, tetapi hubungan baris-dan-lajur hilang . Susun atur kompleks, PDF yang diimbas tanpa lapisan teks yang betul, dan dokumen berbilang lajur menyebabkan paling banyak ralat. Tanpa konteks susun atur, LLM mungkin menghasilkan khayalan nilai atau menghasilkan peninggalan, salah klasifikasi, dan ralat fakta
.
Cabaran berterusan lain termasuk ketegaran kaedah berasaskan peraturan dan kekurangan set data beranotasi khusus domain untuk melatih pendekatan berasaskan pembelajaran .
Beberapa alat AI kini menyasarkan aliran kerja ulasan sistematik dan meta-analisis secara khusus:
AI boleh mengekstrak data, metodologi, dan hasil daripada kajian PDF dengan ketepatan yang berguna dan kelajuan transformatif. Tetapi ia belum cukup dipercayai untuk menggantikan semakan manusia untuk aplikasi kritikal seperti penyerahan kawal selia atau jadual data ulasan sistematik akhir — terutamanya apabila jadual dan susun atur kompleks terlibat. Pengesahan manusia terhadap data yang diekstrak AI kekal sebagai amalan yang disyorkan untuk kes penggunaan kritikal .
Comments
0 comments