Strumenti di intelligenza artificiale che aiutano effettivamente con le revisioni sistematiche della letteratura
Quali strumenti di intelligenza artificiale aiutano davvero con le revisioni sistematiche? Abbiamo testato riassunti, strumenti di screening e assistenti per l'estrazione dei dati su protocolli di revisione reali.
Una revisione sistematica pubblicata su BMJ Open lo scorso anno ha impiegato 14 mesi dalla registrazione del protocollo alla presentazione. Il team di cinque ricercatori ha dedicato oltre 800 ore complessivamente al progetto. Circa il 60% di quel tempo è stato dedicato allo screening, all'estrazione dei dati e alla valutazione della qualità: non all'analisi, non alla scrittura, non al lavoro intellettuale che giustifica l'esistenza di una revisione sistematica.
Volevamo sapere quali strumenti di intelligenza artificiale per la revisione sistematica riducono effettivamente tale onere temporale. Non in teoria. Non in una demo del fornitore. In pratica, su veri protocolli di revisione con veri criteri di inclusione e veri documenti.
Quindi abbiamo eseguito tre test paralleli. Stessi risultati di ricerca su 1.200 documenti. Stessi criteri di inclusione. Una squadra ha utilizzato metodi tradizionali. Uno ha utilizzato strumenti di screening basati sull’intelligenza artificiale. Uno ha utilizzato un approccio misto: intelligenza artificiale per lo screening iniziale, verifica umana per i casi limite. I risultati ci hanno sorpreso.
Il problema del tempo di revisione sistematica
Le revisioni sistematiche seguono una metodologia rigida per una buona ragione. L’approccio strutturato – strategia di ricerca predefinita, criteri di inclusione espliciti, doppio screening, estrazione dei dati standardizzata – è ciò che li separa dalle revisioni narrative e conferisce autorità alle loro conclusioni.
Ma questo rigore comporta un costo enorme in termini di tempo.
Una tipica revisione sistematica nelle scienze della salute esamina 2.000-5.000 titoli e abstract. Ogni decisione di screening richiede 30-60 secondi. Si tratta di 17-83 ore di screening da solo, di solito eseguite in modo indipendente da due revisori, quindi raddoppialo. Poi arriva la revisione del testo completo di 100-300 articoli. Quindi l'estrazione dei dati dai 30-80 che riescono a passare. Quindi valutazione della qualità di ciascuno studio incluso.
L'intera pipeline richiede 6-18 mesi. Ciò non è sostenibile, soprattutto per i ricercatori che hanno bisogno di pubblicare revisioni sistematiche per far avanzare la propria carriera ma hanno anche impegni di insegnamento, supervisione e altri impegni di ricerca.
L’intelligenza artificiale non sostituirà la metodologia. Ma può comprimere fasi specifiche.
Strumenti AI per lo screening e la selezione
Lo screening è la fase che richiede più tempo e quella in cui gli strumenti di intelligenza artificiale hanno fatto i maggiori progressi.
Come funziona lo screening tramite intelligenza artificiale. Addestra lo strumento sui tuoi criteri di inclusione e su un piccolo insieme di documenti già selezionati, forse 50-100 che hai classificato manualmente come "includi" o "escludi". L'intelligenza artificiale apprende lo schema e lo applica ai documenti rimanenti, classificandoli in base alla probabilità di inclusione.
Nel nostro test, il team assistito dall'intelligenza artificiale ha esaminato 1.200 titoli e abstract in 4 ore. La squadra tradizionale ha impiegato 26 ore. Il team misto – primo passaggio dell’IA, verifica umana dei casi limite – ha impiegato 9 ore.
La precisione era la questione cruciale. L’approccio basato esclusivamente sull’intelligenza artificiale aveva una sensibilità del 94%, il che significa che ha identificato correttamente il 94% dei documenti che avrebbero dovuto essere inclusi. Ha mancato il 6%. In termini di revisione sistematica, il tasso di mancata riuscita del 6% è preoccupante. Una revisione sistematica che tralascia studi rilevanti mina il proprio scopo.
L'approccio misto ha colto questi errori. AI ha contrassegnato i documenti come "probabilmente inclusi", "probabilmente esclusi" o "incerti". Gli esseri umani hanno esaminato manualmente la pila "incerta". Sensibilità combinata: 99%. Tempo complessivo: 9 ore contro 26. Questo è l'approccio che consigliamo.
Che cosa cercare in uno strumento di screening. Lo strumento deve accettare i tuoi specifici criteri di inclusione ed esclusione, non solo parole chiave ma criteri concettuali come "studi che coinvolgono popolazioni adulte" o "disegno di studi randomizzati controllati". Dovrebbe fornire punteggi di confidenza per ciascuna decisione e consentire di impostare la soglia per la categoria "incerto". Una soglia più bassa significa che più documenti vengono sottoposti a revisione umana ma meno vengono persi.
Riepilogo AI per l'estrazione dei dati
L'estrazione dei dati è il luogo in cui abbiamo riscontrato che gli strumenti di intelligenza artificiale per la revisione sistematica brillano davvero, e dove sono sottoutilizzati.
L’estrazione tradizionale dei dati significa leggere ogni articolo incluso e inserire manualmente le informazioni in un foglio di calcolo: dimensione del campione, caratteristiche della popolazione, dettagli dell’intervento, misure dei risultati, risultati chiave, indicatori di rischio di bias. Per 50 documenti inclusi, sono necessarie 50-100 ore.
Abbiamo testato l'estrazione dei dati assistita dall'intelligenza artificiale utilizzando AI summaryr configurato per l'estrazione strutturata. Abbiamo alimentato ciascun documento incluso e chiesto punti dati specifici corrispondenti al nostro modulo di estrazione: disegno dello studio, dimensione del campione, dati demografici dei partecipanti, descrizione dell'intervento, misura del risultato primario, risultato principale con dimensione dell'effetto e limitazioni riportate dall'autore.
I risultati sono stati istruttivi. Per i dati chiaramente riportati – dimensione del campione, disegno dello studio, risultato primario – l’intelligenza artificiale ha estratto accuratamente il 92% delle volte. Per i dati sfumati (esattamente quali sottogruppi sono stati analizzati, come è stato gestito l'attrito, quali analisi di sensibilità sono state eseguite) la precisione è scesa al 71%.
Il nostro flusso di lavoro consigliato: utilizza l'intelligenza artificiale per il passaggio di estrazione iniziale, quindi chiedi a un revisore umano di verificare ogni punto dati estratto rispetto al documento originale. Questa fase di verifica richiede circa 10 minuti per foglio rispetto ai 60–120 minuti dell'estrazione manuale completa. Risparmio di tempo totale: circa il 70%.
La fase di verifica non è negoziabile. Una revisione sistematica con dati estratti inaccurati è peggio di nessuna revisione.
Cosa non può (ancora) fare l'intelligenza artificiale nelle revisioni sistematiche
Vogliamo essere diretti riguardo alle limitazioni perché fare promesse eccessive è un vero problema in questo spazio.
La valutazione della qualità richiede giudizio. La valutazione del rischio di bias, utilizzando strumenti come Cochrane RoB 2 o la scala Newcastle-Ottawa, richiede di valutare se la progettazione e la rendicontazione di uno studio sono adeguate. L’intelligenza artificiale può segnalare potenziali preoccupazioni (“nessuna menzione di accecamento” o “tasso di abbandono superiore al 20%)”, ma il giudizio finale sul fatto che questi problemi costituiscano un serio rischio di parzialità richiede competenze metodologiche che mancano all’attuale intelligenza artificiale.
La sintesi è fondamentalmente umana. Decidere se gli studi sono sufficientemente simili da poter essere combinati in una meta-analisi, scegliendo tra modelli a effetti fissi e a effetti casuali, interpretando l'eterogeneità: queste decisioni richiedono competenze statistiche e conoscenza del dominio. L’intelligenza artificiale può organizzare i tuoi dati. Non può effettuare queste chiamate.
Lo sviluppo del protocollo richiede la tua esperienza. Definire la domanda di ricerca, scegliere i database, sviluppare strategie di ricerca, impostare criteri di inclusione: le fondamenta di una revisione sistematica si basano sulla tua conoscenza del campo. Nessuno strumento di intelligenza artificiale può dirti quale domanda vale la pena porre.
Il reporting PRISMA richiede ancora la tua attenzione. Il diagramma di flusso PRISMA, il reporting dettagliato del processo di ricerca e screening: richiedono una documentazione accurata di ciò che è realmente accaduto durante la revisione, incluso il modo in cui hai utilizzato gli strumenti di intelligenza artificiale. Ci si aspetta sempre più trasparenza sui passaggi assistiti dall’intelligenza artificiale.
Speed Up Your Systematic Review
Use structured AI summarization for data extraction. Upload papers and get standardized extraction outputs aligned with your protocol.
Try It FreeI migliori strumenti di revisione sistematica nel 2026
Ecco cosa abbiamo scoperto che funziona, sulla base dei nostri test e delle conversazioni con i team di revisione di sei istituti di ricerca.
Per lo screening: Rayyan e ASReview rimangono gli strumenti di screening dedicati più efficaci. Entrambi supportano lo screening semiautomatico con apprendimento attivo. ASReview è open source e offre un forte supporto per la reportistica conforme a PRISMA del processo di screening assistito dall'intelligenza artificiale. Rayyan offre un'interfaccia più raffinata e migliori funzionalità di collaborazione per i team con più revisori.
Per l'estrazione dei dati: è qui che gli strumenti di intelligenza artificiale generici, incluso il nostro riepilogo, superano effettivamente gli strumenti di revisione sistematica dedicati. Il motivo è la flessibilità. Strumenti dedicati ti bloccano in campi di estrazione predefiniti. Un buon riepilogo AI ti consente di specificare esattamente quali punti dati estrarre, corrispondendo al tuo modulo di estrazione personalizzato. Lo abbiamo trovato particolarmente utile per le revisioni interdisciplinari in cui i modelli di estrazione standard non si adattano.
Per la gestione dei riferimenti e la deduplicazione: Covidence gestisce l'intero flusso di lavoro dallo screening all'estrazione e si integra con i principali gestori di riferimenti. È costoso per i singoli ricercatori, ma ne vale la pena per i team che conducono più revisioni.
Per la traduzione: se la tua recensione include articoli non in inglese (sempre più comuni man mano che le revisioni sistematiche si espandono oltre la letteratura anglofona) gli strumenti di traduzione AI possono aiutarti a selezionare ed estrarre articoli da articoli in altre lingue. Lo abbiamo testato con 40 articoli in tedesco, spagnolo e mandarino e la qualità della traduzione è stata sufficiente per uno screening e un'estrazione accurati in tutte e tre le lingue.
Per la fase di scrittura: Dopo l'estrazione e la sintesi dei dati, è ancora necessario scrivere la recensione. Per il processo di riepilogo della revisione della letteratura che alimenta la tua prosa, abbiamo dettagliato il flusso di lavoro separatamente.
Gli strumenti di revisione sistematica nel 2026 sono davvero migliori di quelli disponibili anche due anni fa. Ma – e questo è importante – nessuna di queste è una soluzione chiavi in mano. Richiedono tutti tempo di configurazione, dati di addestramento e supervisione umana. Budget per questo quando pianifichi la sequenza temporale della revisione.
Una sequenza temporale realistica con l'assistenza dell'intelligenza artificiale
Sulla base dei nostri test, ecco come appare una sequenza temporale di revisione sistematica con gli strumenti di intelligenza artificiale integrati nelle fasi appropriate.
Sviluppo del protocollo: 2–4 settimane. Nessuna scorciatoia AI qui.
Esecuzione della ricerca: 1–2 giorni. I database non sono cambiati molto.
Screening (assistito dall'intelligenza artificiale): 1–2 settimane invece di 4–8 settimane. L'IA fa il primo passaggio. Verifica i casi limite e risolvi i disaccordi.
Revisione del testo completo: 2–3 settimane. Ancora manuale. L'intelligenza artificiale può aiutarti a individuare sezioni specifiche all'interno dei documenti, ma la decisione di inclusione richiede il giudizio umano.
Estrazione dei dati (assistita da IA): 2–3 settimane invece di 6–10 settimane. L'intelligenza artificiale esegue l'estrazione iniziale. Verifica rispetto ai documenti originali.
Valutazione della qualità: 2–3 settimane. Ancora prevalentemente manuale.
Sintesi e scrittura: 4–8 settimane. La tua esperienza guida questa fase.
Totale: 3–6 mesi invece di 8–18 mesi. Si tratta di una differenza significativa per i ricercatori che gestiscono più progetti e scadenze di carriera.
Structured data extraction from academic papers. Customizable extraction fields for systematic review protocols.
Ulteriori letture
- Condensa testo accademico con l'intelligenza artificiale
- Suggerimenti per la revisione della letteratura: come sintetizzare le fonti
Domande frequenti
D: Gli strumenti di intelligenza artificiale possono essere utilizzati nelle revisioni sistematiche della letteratura?
Sì, e lo sono sempre di più. Un sondaggio del 2025 sul Journal of Clinical Epidemiology ha rilevato che il 34% delle revisioni sistematiche pubblicate riportava l’utilizzo di almeno uno strumento assistito dall’intelligenza artificiale, rispetto all’8% nel 2023. La chiave è la trasparenza: segnala quali strumenti hai utilizzato, in quali fasi e come hai verificato i risultati dell’intelligenza artificiale. Le linee guida PRISMA 2020 non vietano l’assistenza dell’intelligenza artificiale e la prossima estensione PRISMA-AI fornirà indicazioni specifiche sulla reportistica per le revisioni assistite dall’intelligenza artificiale.
D: Le linee guida PRISMA consentono lo screening assistito dall'intelligenza artificiale?
Le attuali linee guida PRISMA 2020 non affrontano specificamente lo screening assistito dall’intelligenza artificiale, ma richiedono una rendicontazione trasparente del processo di screening. Se hai utilizzato l'intelligenza artificiale per lo screening iniziale, segnalalo: descrivi lo strumento, i dati di addestramento utilizzati, la soglia di sensibilità impostata e il processo di verifica umana per i casi incerti. La comunità della revisione sistematica si sta muovendo verso una guida esplicita – il gruppo di lavoro PRISMA-AI sviluppa standard di reporting dal 2024 – ma nel frattempo la trasparenza è la vostra salvaguardia.
D: Quale strumento di intelligenza artificiale è il migliore per le revisioni sistematiche?
Non esiste un unico strumento migliore perché le revisioni sistematiche comportano più attività distinte. Per lo screening, ASReview (open source) e Rayyan offrono il miglior screening assistito dall'intelligenza artificiale supportato da prove. Per l'estrazione dei dati, i riepilogatori IA generici con funzionalità di estrazione strutturata, come i nostri, offrono maggiore flessibilità rispetto agli strumenti dedicati. Per l'intero flusso di lavoro, Covidence offre l'esperienza più integrata. Ti consigliamo di combinare gli strumenti in base alle esigenze specifiche della tua recensione anziché forzare un'unica piattaforma a gestire tutto.

Ema is a senior academic editor at ProofreaderPro.ai with a PhD in Computational Linguistics. She specializes in text analysis technology and language models, and is passionate about making AI-powered tools that truly understand academic writing. When she's not refining proofreading algorithms, she's reviewing papers on NLP and discourse analysis.