How to Use AI for a PRISMA-Compliant Systematic Review
A practical guide to using AI in systematic reviews without breaking PRISMA compliance. Where AI legitimately helps (screening, extraction), where it shouldn't, the reporting requirements, and a step-by-step workflow.
Uma revisão sistemática costumava levar de seis a nove meses para uma equipe de três pesquisadores. O gargalo não era a leitura – era a triagem. Doze mil resumos retirados do PubMed, Embase, Scopus e Cochrane, cada um necessitando de dois revisores independentes para decidir incluir ou excluir de acordo com critérios pré-registrados. A época em que a matemática impulsionou as carreiras em torno disso.
A IA mudou essa matemática. Os modelos de linguagem modernos podem selecionar resumos em segundos, extrair características de estudos de PDFs de texto completo em minutos e resumir centenas de artigos em horas. Usada com cuidado, a IA reduz a fase de triagem de uma revisão de meses para semanas. Usado de forma descuidada, produz um documento não reproduzível e não conforme que falha na revisão por pares.
Este guia explica onde a IA ajuda legitimamente em uma revisão em conformidade com PRISMA, onde ela não deveria estar fazendo o trabalho, os requisitos de relatórios que acompanham o uso de IA e um fluxo de trabalho passo a passo que satisfaz PRISMA 2020 e a extensão PRISMA-trAIce.
O que PRISMA realmente requer (recapitulação rápida)
PRISMA 2020 é a lista de verificação de relatórios padrão para revisões sistemáticas. Ele rege como você descreve o que fez, não como você o faz. As peças relevantes para uso de IA são:
Relatórios de estratégia de pesquisa. Documente cada banco de dados pesquisado, cada string de pesquisa usada, cada data em que as pesquisas foram executadas. A reprodutibilidade é o padrão – outro pesquisador deverá ser capaz de executar novamente sua pesquisa e obter os mesmos resultados.
Relatórios de triagem. Documente quantos registros foram selecionados, por quantos revisores independentes, como as divergências foram resolvidas e quantos foram excluídos em cada etapa. O diagrama de fluxo clássico PRISMA reside aqui.
Relatórios de extração de dados. Documente quais dados foram extraídos, por quem e como as divergências foram resolvidas.
Avaliação do risco de viés. Documente a ferramenta usada (Cochrane RoB 2, ROBINS-I, etc.) e quem a executou.
Comunicar quaisquer desvios. Tudo o que não estiver de acordo com o protocolo pré-cadastrado deverá ser comunicado, com fundamentação.
A extensão PRISMA-trAIce (publicada em 2024, atualizada em 2025) adiciona requisitos de relatórios específicos de IA além de PRISMA 2020. A versão curta: em qualquer lugar onde a IA foi usada na revisão, você relata a ferramenta, a versão, os prompts e como a verificação humana foi realizada.
Where AI legitimately helps
São usos em que a IA acelera o trabalho sem alterar o que é a revisão.
Detecção de duplicatas. Registros extraídos de vários bancos de dados geralmente são duplicados. Os gerenciadores de referência tradicionais (Zotero, EndNote, Covidence) fazem isso muito bem. A IA é um exagero aqui – continue usando as ferramentas padrão.
Título inicial e triagem de resumos. A IA pode pontuar cada resumo de acordo com seus critérios de inclusão e classificá-los ou pré-classificá-los. Dois revisores humanos ainda precisam tomar a decisão final de inclusão/exclusão, mas a pré-classificação da IA reduz substancialmente o tempo humano. Este é o uso de IA de maior valor na maioria das análises.
Recuperação e triagem de texto completo. A IA pode extrair metadados de publicações, identificar se um texto completo corresponde às afirmações do resumo (ocasionalmente não) e sinalizar artigos que parecem ser resumos de conferências, erratas ou publicações duplicadas com títulos diferentes.
Extração de dados de artigos estruturados. Tabelas de características dos pacientes, dosagens e tamanhos de efeito — a IA pode extraí-los de PDFs de texto completo para uma planilha estruturada de extração de dados, que dois revisores humanos verificam. O tempo de verificação é muito menor do que a extração manual completa.
Síntese e suporte à redação. Elaboração da descrição do procedimento de triagem da seção de métodos, elaboração do texto do diagrama de fluxo PRISMA, resumo da tabela de características dos estudos incluídos — a IA ajuda na redação sem alterar a substância da revisão.
Tradução de fontes que não sejam do inglês. Se a sua revisão incluir artigos que não sejam do inglês, a tradução da IA tornou-se confiável o suficiente para apoiar a inclusão dessas fontes. Documente a ferramenta usada nos métodos.
Where AI should NOT do the work
Esses usos ultrapassam os limites da tomada de decisões substantivas que os revisores humanos devem fazer.
Decisões finais de inclusão/exclusão. PRISMA requer dois revisores humanos independentes para inclusão/exclusão. A IA pode pré-classificar, classificar e revelar candidatos – mas a decisão vinculativa deve ser humana. Isso não é negociável para conformidade.
Avaliação do risco de viés. As ferramentas RoB exigem julgamento sobre o desenho do estudo, cegamento, desgaste e relatórios. A IA pode resumir o que o artigo diz sobre cada domínio, mas a classificação de preconceito em si deve ser humana.
Avaliação da qualidade e grau de evidência (GRADE). Mesma lógica. A IA resume; taxa de humanos.
Interpretação da heterogeneidade. Se as diferenças entre os resultados dos estudos refletem a heterogeneidade clínica, a heterogeneidade metodológica ou o acaso é uma questão de julgamento que requer conhecimentos clínicos e metodológicos.
Síntese final e conclusões. A síntese narrativa, a discussão dos pontos fortes e limitações, as implicações clínicas — estas são as contribuições da equipe de revisão. A IA pode redigir a linguagem inicial, mas os julgamentos substantivos são seus.
Detecção de conteúdo fabricado ou de fábrica de papel. Ironicamente, a detecção de estudos fabricados por IA continua não confiável. Olhos humanos em papéis suspeitos, além de ferramentas como o Problematic Paper Screener, são o padrão atual.
The reporting requirements
Se você usar IA em qualquer parte da revisão, PRISMA-trAIce exigirá que você denuncie. A estrutura que satisfaz a maioria dos periódicos:
Na seção de métodos, subseção de procedimento de triagem:
A triagem de resumos foi realizada usando um processo de duas etapas. Inicial
a classificação foi realizada usando [Nome da ferramenta, versão, acessado via
API/web em datas] com o seguinte modelo de prompt: "[prompt exato]".
A classificação foi utilizada para priorizar os resumos para revisão humana.
Todos os resumos, independentemente da classificação inicial, foram então selecionados
de forma independente por dois revisores ([iniciais do autor]) usando [Covidence/
Rayyan/outra ferramenta], com divergências resolvidas por discussão ou por
um terceiro revisor ([iniciais do autor]) quando o consenso não foi alcançado.
Em um exercício de calibração realizado em [número] resumos antes do
triagem principal, a classificação AI concordou com o consenso humano
decisão em [percentagem]% dos casos. AI não foi usada para final
decisões de inclusão ou exclusão.
Na seção de métodos, subseção de extração de dados:
Data extraction was performed using a structured form (Appendix [X]).
Extraction of [specific data types, e.g., patient characteristics,
intervention details, outcome measurements] was supported by [Tool
Name, version], which extracted candidate values from full-text PDFs.
All extracted values were verified against the source PDFs by two
reviewers ([author initials]). Discrepancies between AI-extracted
values and source documents were corrected against the source in
[percentage]% of cases. The verified data informed the final
synthesis.
Em uma subseção dedicada "Uso de IA" (às vezes necessária separadamente):
The following AI tools were used in this review: [list each tool,
version, date range, and specific role]. No AI tool was used for
risk of bias assessment, quality grading, interpretation of
heterogeneity, or synthesis of conclusions. All AI-supported steps
were verified by [number] human reviewers as described above. The
prompts used are provided in Appendix [Y].
In the limitations section:
Reconheça as limitações relacionadas com a IA: potencial enviesamento sistemático na pré-classificação, dependência de ferramentas de IA cujo funcionamento interno não é transparente e a impossibilidade de reproduzir integralmente o comportamento da IA nas versões do modelo.
Summarize and Extract — with Verifiable Outputs
Paste a paper or paste an extraction request. Get back content you can verify against the source — fast.
Try the AI SummarizerThe workflow we recommend
A sequence that satisfies PRISMA-trAIce and uses AI's strengths.
Etapa 1: Pré-registrar o protocolo. Antes de qualquer uso de IA, registre a avaliação (PROSPERO para avaliações médicas; OSF para outras). O protocolo especifica critérios de inclusão, estratégia de busca, método de triagem, plano de extração e abordagem de síntese. Especifique no protocolo onde a IA será usada e como. O pré-registro que menciona IA é muito mais forte do que a divulgação post-hoc.
Etapa 2: execute o exercício de calibração. Escolha de 100 a 200 resumos em sua pesquisa. Peça a dois revisores humanos que os examinem de forma independente. Execute a triagem de IA no mesmo conjunto com o prompt planejado. Calcular métricas de concordância (kappa de Cohen, concordância percentual). Se a concordância da IA estiver abaixo de 0,7 kappa ou 80% com a decisão humana consensual, refine a solicitação ou reconsidere o uso da IA.
Etapa 3: Execute a passagem de triagem principal da IA. Com um prompt calibrado, faça a triagem do corpus abstrato completo. Saída: uma lista classificada ou classificada. Os revisores humanos veem essa classificação, mas tomam suas próprias decisões independentes.
Etapa 4: Triagem independente de dois revisores. Cada resumo ainda recebe dois revisores humanos. A classificação da IA consiste em metadados, não em voto. Desacordos resolvidos por discussão ou por um terceiro revisor.
Etapa 5: Triagem de texto completo com assistência de IA. A IA pode sinalizar exclusões óbvias na fase de texto completo (idioma errado, apenas resumo, artigos retratados). Os humanos tomam decisões finais.
Etapa 6: Extração de dados com assistência e verificação de IA. A IA extrai valores candidatos; dois revisores humanos verificam a fonte. O próprio log de verificação torna-se uma prova de conformidade.
Etapa 7: Risco de preconceito — apenas humano. Nenhuma IA nesta etapa.
Etapa 8: Síntese – escrita liderada por humanos e assistida por IA. Humanos interpretam. A IA ajuda a resumir estudos para a tabela de estudos incluídos, redigir a seção de métodos e aprimorar a prosa. A interpretação substantiva permanece humana.
Etapa 9: Divulgar de forma abrangente. A seção de métodos relata o uso de IA conforme descrito acima. Uma [declaração de divulgação de uso de IA] completa (/blog/ai-disclosure-statement-manuscript) aparece no assunto inicial ou nos agradecimentos. Os prompts completos usados vão em um apêndice.
Etapa 10: Auditoria de pré-publicação. Antes do envio, um segundo membro da equipe audita as etapas apoiadas pela IA para verificar se a documentação está completa. Prompts ausentes, números de versão ausentes ou porcentagens de verificação ausentes são os gatilhos comuns de rejeição.
Common pitfalls
Características alucinadas do estudo. A IA às vezes extrai dados que não estão no artigo de origem — intervalos de confiança que não existem, tamanhos de amostra que não correspondem, detalhes de intervenção fabricados a partir do contexto. A verificação contra a fonte é a única defesa. Se sua equipe não verificar todos os valores extraídos, você publicará erros.
Desvio imediato ao longo da revisão. Uma revisão imediata e refinada no meio da revisão altera o comportamento da IA em itens já selecionados. Se você alterar o prompt, documente o motivo e revise os itens afetados.
Excesso de confiança na classificação da IA. Algumas equipes delegaram efetivamente decisões de inclusão à IA, tratando sua classificação como oficial. PRISMA requer decisões humanas. A entrada de IA está boa; As decisões de IA não são.
Esquecimento de documentar desvios. Qualquer coisa que divirja do protocolo pré-cadastrado deverá ser comunicado. Se o uso da IA evoluiu durante a revisão, documente a evolução. Alterações ocultas no processo são sinalizadas na revisão por pares.
Versões de ferramentas inconsistentes. Atualização de modelos de IA. O DeepSeek V3 que analisou os resumos em janeiro não é idêntico à versão disponível em junho. Documente a versão e o intervalo de datas de cada ferramenta de IA usada.
Precisão da tradução presumida, não verificada. A tradução de IA é boa, mas não perfeita, especialmente para conteúdo clínico ou técnico. Se forem incluídas fontes em outros idiomas, documente quem verificou as traduções.
Summarize papers, extract study characteristics, and draft synthesis text. Free tier includes every feature.
Frequently asked questions
Q: Can I include AI-screened abstracts in my PRISMA flow diagram?
Sim, mas com atribuição específica. O diagrama de fluxo padrão PRISMA 2020 possui campos para registros identificados, registros selecionados, registros avaliados quanto à elegibilidade e registros incluídos. Se a IA foi usada na triagem, adicione uma nota ao diagrama ou à sua legenda: "A classificação inicial apoiada pela IA foi usada para classificar os resumos; todos os resumos receberam triagem humana independente por dois revisores." Alguns periódicos agora solicitam um diagrama de fluxo mais detalhado que descreva as etapas apoiadas pela IA e as etapas apenas humanas. A extensão PRISMA-trAIce fornece modelos para isso.
P: Como posso citar as ferramentas de IA usadas na minha revisão sistemática?
Cite o modelo com sua versão e a data de acesso. Formato padrão: "[Nome do modelo], versão [X.Y], acessado [intervalo de datas] via [endpoint da API/interface web] (desenvolvedor: [Empresa]). URL: [link para documentação, se disponível]." Alguns periódicos exigem uma citação mais detalhada, incluindo os parâmetros exatos da API usados. Verifique as instruções da revista para autores. As convenções de citação de ferramentas de IA ainda estão evoluindo – em caso de dúvida, inclua mais detalhes em vez de menos.
P: Qual é a diferença entre PRISMA 2020 e PRISMA-trAIce?
PRISMA 2020 é o checklist padrão para relatórios de revisões sistemáticas, atualizado a partir da versão 2009. PRISMA-trAIce (publicado em 2024) é uma extensão que adiciona requisitos de relatórios para etapas apoiadas por IA no processo de revisão. A maioria dos periódicos agora exige ambos: PRISMA 2020 para relatórios gerais, PRISMA-trAIce para quaisquer etapas apoiadas por IA. A lista de verificação trAIce possui 12 itens que abrangem documentação da ferramenta, relatórios imediatos, métricas de calibração e procedimentos de verificação humana. Se você usar IA em qualquer lugar de uma revisão sistemática, aborde PRISMA-trAIce na seção de métodos. Para obter um guia de fluxo de trabalho mais amplo que complemente este, consulte Usando IA para acelerar sua revisão de literatura.
P: O uso de IA na minha revisão sistemática reduzirá minhas chances de aceitação?
Na nossa experiência, o uso de IA divulgado e devidamente documentado não reduz as taxas de aceitação e muitas vezes acelera a revisão (os métodos são mais claros e defensáveis). O que reduz a aceitação é o uso não divulgado de IA, o uso de IA que substitui o julgamento humano exigido ou as limitações relacionadas à IA que não são reconhecidas. O sinal ao qual os editores e revisores respondem é o rigor e a transparência, e não a abstenção da IA. Uma revisão sistemática que utiliza IA para triagem, relata o uso detalhadamente, inclui métricas de calibração e reconhece as limitações é tratada como uma revisão metodologicamente moderna – e não comprometida.

Ema is a senior academic editor at ProofreaderPro.ai with a PhD in Computational Linguistics. She specializes in text analysis technology and language models, and is passionate about making AI-powered tools that truly understand academic writing. When she's not refining proofreading algorithms, she's reviewing papers on NLP and discourse analysis.