Stora språkmodeller (LLM) kan systematiskt gynna eller utesluta vissa studier, språk eller resultat. Forskare bör jämföra AI:s screeningbeslut mot en guldstandard av mänskliga bedömningar för att kalibrera .
Maskininlärningssystem tränas ofta på konventionell visdom och publicerad litteratur, vilket redan är snedvridet mot positiva resultat. Detta kan tyst förstärka befintliga bias i evidensbasen .
Acceptera inte blint AI-föreslagna studier, extraherade data eller risk-of-bias-bedömningar. Gör stickprovskontroller på en betydande slumpmässig andel manuellt .
2025 utfärdade Cochrane, Campbell Collaboration, JBI och Collaboration for Environmental Evidence ett gemensamt uttalande som kräver att all AI-användning vid evidenssyntes rapporteras öppet .
En trepelarriktlinje för ansvarsfull AI i systematiska översikter föreskriver retrieval-augmented generation (RAG) med verifierbar källhänvisning, och positionerar AI som en "kalibrerad partner" snarare än en ersättning .
Förbättrad transparens, tydligare rapporteringsstandarder och ökad användarutbildning krävs för att stödja en ansvarsfull användning av AI i evidenssyntes .
AI kan minska den manuella arbetsbördan med 50–75% vid litteraturscreening, dataextraktion och risk-of-bias-bedömning utan att tumma på PRISMA-godkänd noggrannhet – förutsatt att det kombineras med forskares tillsyn . Men samma studier bekräftar att AI introducerar egna bias (urvalsbias, konfirmationsbias, träningsdatabias). Motgiftet är mänsklig tillsyn, transparent rapportering och rigorös validering. Lämna aldrig över det kritiska tänkandet till verktyget.
Comments
0 comments