Para puntos de datos más simples como el año de publicación, el país o el número de participantes, la IA funciona bien. Le cuesta más con datos complejos como descripciones de resultados o detalles de intervenciones .
En un proyecto real de estudio clínico, la extracción automatizada con IA a partir de documentos PDF resultó en un aumento de velocidad de 500 veces en comparación con la extracción manual, junto con resultados más precisos y una reducción significativa del esfuerzo manual . Esto implicó entrenar un modelo de lenguaje preentrenado específico del dominio para reconocer 20 entidades relevantes (por ejemplo, nombre del fármaco, fechas de inicio y fin del ensayo)
.
La recuperación de la estructura de tablas es una debilidad importante. Un benchmark en 200 documentos reales encontró que los analizadores de PDF básicos obtuvieron una puntuación de 0.000 en recuperación de estructura de tablas — el texto se extrae, pero se pierden las relaciones entre filas y columnas . Los diseños complejos, los PDF escaneados sin capas de texto adecuadas y los documentos de varias columnas causan la mayoría de los errores. Sin el contexto del diseño, los LLMs pueden alucinar valores o producir omisiones, clasificaciones erróneas y errores factuales
.
Otros desafíos persistentes incluyen la rigidez de los métodos basados en reglas y la falta de conjuntos de datos anotados específicos del dominio para entrenar enfoques basados en aprendizaje .
Varias herramientas de IA se enfocan ahora específicamente en el flujo de trabajo de revisión sistemática y metaanálisis:
La IA puede extraer datos, metodología y resultados de estudios en PDF con una precisión útil y una velocidad transformadora. Pero aún no es lo suficientemente fiable como para reemplazar la revisión humana en aplicaciones críticas como presentaciones regulatorias o tablas de datos finales de revisiones sistemáticas — especialmente cuando hay tablas y diseños complejos involucrados. La validación humana de los datos extraídos por IA sigue siendo la práctica recomendada para casos de uso críticos .
Comments
0 comments