Artigo Original

Pericia Medica na Era da Inteligencia Artificial: vies, pos-verdade e o risco do erro coerente na construcao da prova pericial

Como citar: Oliveira HBD. Pericia Medica na Era da Inteligencia Artificial: vies, pos-verdade e o risco do erro coerente na construcao da prova pericial. Persp Med Legal Pericia Med. Vol. 11, 2026; 260533.

https://dx.doi.org/10.47005/260533

Recebido em 09/04/2026
Aceito em 21/05/2026

Baixar PDF

O autor informa não haver conflito de interesse.

MEDICAL EXPERTISE IN THE AGE OF ARTIFICIAL INTELLIGENCE: BIAS, POST-TRUTH, AND THE RISK OF COHERENT ERROR IN THE CONSTRUCTION OF EXPERT EVIDENCE

Heriberto Brito de Oliveira

Conceitualização, Curadoria de dados, Análise de dados, Pesquisa, Metodologia, Administração do projeto, Recursos , Visualização da apresentação de dados, Redação do manuscrito original, Redação - revisão e edição

https://orcid.org/0000-0002-5026-5600 - http://lattes.cnpq.br/1832473829182736

TRT 15 Região, São José dos Campos, SP

Resumo

INTRODUÇÃO: A mediação algorítmica do raciocínio técnico desloca o problema do viés do indivíduo para um sistema híbrido humano-tecnológico, no qual a IA influencia seleção, hierarquização e interpretação das evidências, alterando a construção da prova pericial  METODOLOGIA: Revisão narrativa estruturada com busca em bases biomédicas e documentos institucionais, incluindo estudos experimentais, revisões sistemáticas, metanálises e artigos conceituais, com distinção entre níveis de evidência  FUNDAMENTAÇÃO TEÓRICA: O viés em IA é distribuído ao longo do ciclo de vida, podendo ser reforçado pela interação humano-máquina, enquanto evidências recentes demonstram a possibilidade de manipulação estrutural do conhecimento interno dos modelos  RESULTADOS: Predominam estudos observacionais com risco de viés elevado, além da demonstração de que modelos podem incorporar informações incorretas de forma persistente e coerente, mantendo desempenho aparente  DISCUSSÃO: Propõe-se o conceito de erro coerente, caracterizado por coerência lógica sustentada em premissas epistemicamente comprometidas, inserido no contexto da pós-verdade e amplificado pela mediação algorítmica  CONCLUSÃO: O desafio central é epistemológico, exigindo vigilância crítica sobre a integridade das premissas, reconhecimento dos limites da coerência como critério de validade e preservação do julgamento independente do perito 

Palavras Chave: Pericia medica; inteligencia artificial; vies; epistemologia; prova pericial; pos-verdade.

Abstract

INTRODUCTION: Algorithmic mediation transforms technical reasoning by influencing the selection, prioritization, and interpretation of evidence, reshaping the construction of expert testimony  METHODS: A structured narrative review was conducted using biomedical databases and institutional documents, including experimental studies, systematic reviews, meta-analyses, and conceptual articles, with attention to levels of evidence  THEORETICAL FRAMEWORK: AI bias is distributed throughout its lifecycle and reinforced through human-machine interaction, while recent evidence demonstrates the possibility of structural manipulation of internal model knowledge  RESULTS: The literature is predominantly observational with high risk of bias, and models can incorporate incorrect biomedical information persistently and coherently while maintaining apparent performance  DISCUSSION: The concept of coherent error is proposed, defined as logically consistent reasoning built upon epistemically compromised premises, amplified in a post-truth context and by algorithmic mediation  CONCLUSION: The central challenge is epistemological, requiring critical vigilance over the integrity of premises, recognition of the limits of coherence as a validity criterion, and preservation of independent expert judgment 

Keywords (MeSH): Medical expertise; artificial intelligence; bias; epistemology; expert evidence; post-truth.

1. INTRODUÇÃO

A perícia médica ocupa posição central na formação da prova técnica no sistema de justiça, sendo responsável por traduzir fenômenos clínicos em conclusões juridicamente relevantes. Tradicionalmente, os principais riscos associados à atividade pericial estavam relacionados a vieses cognitivos individuais. No entanto, a incorporação progressiva da inteligência artificial (IA) introduz uma transformação qualitativa nesse cenário.

A IA não apenas organiza informações, mas passa a mediar o próprio raciocínio técnico, influenciando a seleção, a hierarquização e a interpretação das evidências. Nesse contexto, o viés deixa de ser um fenômeno localizado no indivíduo e passa a ser distribuído ao longo de um sistema híbrido humano-tecnológico.

Avanços recentes demonstram que essa mediação pode ser ainda mais profunda. Modelos de linguagem não apenas produzem respostas, mas armazenam e operam sobre estruturas internas de conhecimento. A possibilidade de alteração dessas estruturas desloca o problema do erro do nível interpretativo para o nível estrutural do conhecimento.

2. MATERIAL E MÉTODO

Revisão narrativa estruturada com busca nas bases PubMed, além de documentos institucionais. Foram incluídos estudos sobre história da IA, aplicações médicas, viés algorítmico, interação humano-máquina, segurança de modelos e epistemologia da ciência.
Foram incluídos estudos experimentais, revisões e artigos conceituais. Complementarmente, foram analisados documentos institucionais brasileiros, incluindo publicações do Conselho Nacional de Justiça, com foco na incorporação da IA no Judiciário.

2.1 FUNDAMENTAÇÃO TEÓRICA

A IA, desde sua formalização no Dartmouth Workshop em 1956, evoluiu de sistemas simbólicos para modelos estatísticos capazes de inferir padrões a partir de grandes volumes de dados, com crescente incorporação na prática médica. Essa transformação ampliou a capacidade diagnostica e organizacional, mas introduziu novos riscos epistemológicos.

O viés em IA deve ser compreendido como fenômeno distribuído ao longo de todo o seu ciclo de vida. Pode emergir na coleta de dados, na modelagem, na interação com o usuário e na aplicação prática. A formulação da pergunta influencia diretamente a resposta, podendo reforçar hipóteses iniciais e gerar ciclos de retroalimentação.

A exposição reiterada à IA pode levar à internalização de padrões de raciocínio, enquanto a confiança na tecnologia pode reduzir a vigilância crítica. Esses elementos configuram um ambiente propício à amplificação de vieses.
Adicionalmente, estudos recentes demonstram que modelos de linguagem armazenam associações factuais em estruturas internas específicas, passíveis de modificação direcionada, o que introduz uma nova dimensão de risco.

3. RESULTADOS

Evidências demonstram que o viés na IA e distribuído ao longo de todo o seu ciclo de vida (1), pode ser internalizado por usuários (2), amplificado pela confiança na tecnologia (3) e, mais recentemente, inserido por meio de manipulação direta dos parâmetros do modelo (4). Esse último mecanismo permite a incorporação estrutural de informações biomédicas incorretas, que passam a ser utilizadas de forma consistente e coerente em diferentes contextos.

O principal desafio da perícia médica na era da IA e epistemológico. A qualidade da prova pericial dependera da capacidade de garantir não apenas coerência argumentativa, mas integridade das premissas que sustentam o raciocínio técnico.

4. DISCUSSÃO

O problema contemporâneo da IA aplicada a medicina, e de forma ainda mais sensível a perícia médica, não pode ser reduzido a uma questão de desempenho técnico ou acurácia diagnóstica. Trata-se, antes de tudo, de um problema epistemológico.

4.1 EVOLUÇÃO HISTÓRICA DA IA E SUAS IMPLICAÇÕES MÉDICAS

A primeira fase da IA, dominada por sistemas simbólicos e especialistas, foi marcada pela tentativa de externalizar o raciocínio médico em regras verificáveis (5,6). O MYCIN, desenvolvido na Universidade de Stanford na década de 1970, representou o apogeu dessa abordagem: um sistema de regras explicitas capaz de sugerir antibióticos com desempenho comparável ao de especialistas (6).

Entretanto, sua adoção clínica foi limitada pela rigidez dos modelos e pela dificuldade de atualização.
A transição para modelos estatísticos de aprendizado de máquina e, mais recentemente, para redes neurais profundas (deep learning) alterou fundamentalmente essa dinâmica (7-10). O conhecimento médico deixou de ser explicitamente codificado e passou a ser inferido probabilisticamente a partir de grandes volumes de dados. Essa mudança trouxe ganhos significativos de desempenho em tarefas específicas, como classificação de imagens dermatológicas (7) e detecção de pneumonia (8), mas também introduziu uma opacidade estrutural: o modelo opera, mas sua lógica interna torna-se parcialmente inacessível.

Os modelos de linguagem de larga escala (large language models — LLMs) representam a expressão mais recente dessa evolução (11,12). Eles demonstraram capacidade de codificar conhecimento clínico em escala sem precedentes e de responder a consultas médicas com desempenho comparável ao de profissionais especializados (11). Entretanto, sua arquitetura probabilística os torna suscetíveis a padrões de erro qualitativamente distintos dos sistemas anteriores.

4.2 O VIÉS COMO FENÔMENO DISTRIBUÍDO, COGNITIVO E ESTRUTURAL

A discussão inicial sobre IA concentrou-se no viés como distorção decorrente de dados imperfeitos. Estudos demonstraram, contudo, que o viés pode emergir em todas as etapas do ciclo de vida dos sistemas, da coleta de dados a aplicação clínica (1). Posteriormente, evidenciou-se que esse viés não permanece restrito ao sistema: usuários expostos a IA enviesada tendem a internalizar e reproduzir esses padrões mesmo na ausência da ferramenta12. Além disso, a confiança na IA pode alterar o julgamento humano, reduzindo a vigilância crítica e favorecendo decisões automatizadas (3).

Esse conjunto de fenômenos já seria suficiente para deslocar o problema do viés do campo estritamente tecnológico para o campo cognitivo e relacional. No entanto, evidencias mais recentes indicam que o problema e ainda mais profundo.
Estudos experimentais demonstram que modelos de linguagem médica podem sofrer manipulação direta de seu conteúdo interno por meio de modificações mínimas em seus parâmetros, técnica conhecida como model editing (4). Essa intervenção e suficiente para inserir informações biomédicas incorretas que passam a ser utilizadas de forma consistente em diferentes contextos clínicos. O aspecto mais relevante não e apenas a inserção do erro, mas sua incorporação estrutural: o modelo não apenas repete a informação incorreta, ele passa a raciocinar a partir dela.

Esse tipo de erro apresenta quatro características que o distinguem radicalmente do erro clássico: persistência ao longo do tempo; generaliza para múltiplos contextos; indefectibilidade por métricas tradicionais de avaliação; e, sobretudo, coerência interna elevada. As respostas produzidas são plausíveis, bem estruturadas e tecnicamente consistentes.

O trabalho recente de Han et al. não se limita a descrever fenômenos conhecidos como “alucinações” em IA. Trata-se de evidência experimental de natureza mais profunda e preocupante. Os autores demonstram que é possível alterar o conhecimento interno de modelos de linguagem médica por meio da modificação de aproximadamente 1,1% de seus parâmetros, sem prejuízo mensurável do desempenho global do sistema.

4.3 O CONCEITO DE ERRO COERENTE

E nesse ponto que se torna necessário introduzir o conceito de erro coerente. Erro coerente não é um erro evidente. Não é uma falha lógica. Não é uma inconsistência explicita. Ao contrário, trata-se de uma construção que mantem integridade formal, mas que se apoia em premissas epistemicamente comprometidas. Sua forca está exatamente na aparência de racionalidade.
Operacionalmente, o erro coerente pode ser identificado pela coexistência de: (a) coerência logica preservada; (b) linguagem técnica adequada; (c) ausência de inconsistência interna explicita; (d) seleção parcial de evidências; e (e) ausência de hipóteses alternativas. A aparência de rigor científico mascarara a fragilidade epistemológica das premissas.
Dois exemplos aplicados ilustram esse risco na prática pericial. No estabelecimento de nexo causal, a IA pode estruturar uma associação sustentada por literatura selecionada sem análise crítica de evidências contrarias — produzindo um argumento plausível sobre uma base parcial. Na avaliação de incapacidade laborativa, pode gerar conclusão baseada em descrição funcional isolada, sem contextualização longitudinal, um laudo coerente, porém epistemicamente insuficiente.

4.4 PÓS-VERDADE, MEIA VERDADE E O NÍVEL PRÉ-ARGUMENTATIVO

O fenômeno do erro coerente não pode ser compreendido isoladamente. Ele se insere em um contexto mais amplo de transformação da relação entre verdade e conhecimento, descrito na literatura como pós-verdade (13). Conforme analisado por Arendt (14), a manipulação da verdade factual constitui instrumento central de poder. McIntyre (13) amplia essa análise ao demonstrar que, na pós-verdade, a realidade deixa de ser o ponto de partida do debate, a narrativa plausível substitui o fato verificável.

Nesse contexto, emerge um elemento particularmente sofisticado: a meia verdade. Diferentemente da falsidade explicita, a meia verdade e uma estrutura retorica que combina dados corretos com omissões relevantes, produzindo narrativas plausíveis que resistem a refutação direta, precisamente porque contém elementos verdadeiros (15). A IA não cria esse fenômeno, mas o amplifica: ao organizar informações de forma coerente, a IA aumenta a plausibilidade de narrativas baseadas em recortes parciais.

Esse ponto e fundamental para a prática pericial. Durante a pandemia de COVID-19, observou-se que grande parte dos debates científicos não ocorria nos níveis inferiores da Pirâmide de Graham, insulto ou contradição, mas abaixo dela: o fenômeno dominante foi o uso de dados corretos fora de contexto, seleção parcial de evidências e construção de narrativas tecnicamente plausíveis, porém epistemicamente frágeis (15,16). A IA e capaz de reproduzir e amplificar esse padrão de forma automatizada.

A adaptação da Pirâmide de Graham proposta neste trabalho (Figura 1) introduz um nível pré-argumentativo que a versão original não contempla. Antes do debate, há a construção da realidade: e nesse nível que surgem descontextualização, seleção parcial de evidências e meias verdades. Nessas condições, o debate já nasce comprometido, independentemente da qualidade formal do argumento. O maior risco contemporâneo não é argumentar mal, mas argumentar bem sobre uma base distorcida.

Figura 1. Pirâmide de Graham adaptada para a era da pós-verdade. O modelo original de Graham (16), que classifica níveis de discordância, e ampliado com a adição de um nível pré-argumentativo situado abaixo do debate, compreendendo Desinformação Intencional, Meia Verdade Estratégica e Descontextualização. O eixo vertical representa o Compromisso com a Verdade; o eixo horizontal representa a Qualidade do Argumento. O nível superior e denominado Alta Integridade Intelectual (adaptada pelos autores).

4.5 O CICLO DO VIÉS NA PERÍCIA MÉDICA MEDIADA POR IA

O modelo conceitual proposto (Figura 2) descreve um ciclo progressivo que se inicia na formulação da pergunta, etapa que já carrega pressupostos, e avança pela resposta mediada pela IA, construção narrativa, validação, internalização do padrão pelo perito e, por fim, dependência cognitiva. A decisão pericial resultante, portanto, não é produto de um erro pontual, mas de um processo estruturado e cumulativo.

Esse ciclo tem implicações práticas imediatas. O perito que formula uma pergunta diretiva a um LLM obtém uma resposta coerente com sua hipótese inicial. Ao validar essa resposta, reforça a hipótese. Ao incorporá-la ao laudo, estrutura a prova sobre premissas que nunca foram genuinamente questionadas. A coerência do produto mascara a fragilidade do processo que o gerou.

Figura 2. Modelo conceitual do ciclo do viés na perícia médica mediada por IA. O modelo descreve sete etapas sequenciais: (1) Formulação da Pergunta; (2) Processamento pela IA; (3) Construção da Narrativa; (4) Confiança e Validação; (5) Internalização do Padrão; (6) Dependência Cognitiva; e (7) Decisão Pericial. O centro do ciclo representa o risco de Erro Coerente (autoria própria).

 

4.6 MEDIAÇÃO ALGORÍTMICA DA PROVA PERICIAL E A LACUNA REGULATÓRIA

A incorporação da IA no Judiciário brasileiro, especialmente no âmbito do Conselho Nacional de Justiça (17), introduz uma nova etapa na cadeia de formação da prova pericial. Nesse contexto, a prova deixa de ser apenas produzida e interpretada e passa a ser também mediada por sistemas algorítmicos, capazes de organizar, sintetizar e priorizar informações. Essa mediação amplifica os riscos descritos: priorização seletiva de dados, simplificação indevida de contextos complexos e reforço de padrões narrativos enviesados.

Um laudo pode apresentar elevada coerência técnica, fundamentação aparente e consistência logica, e ainda assim estar epistemicamente comprometido. A coerência passa a ser insuficiente como critério de validade.
A literatura nacional evidencia que a adoção da IA na perícia médica ocorre em cenário de ausência de regulamentação específica consolidada (18), favorecendo heterogeneidade de uso e incertezas quanto a responsabilidade técnica. Em paralelo, as iniciativas institucionais indicam que a incorporação da IA no Judiciário já está em curso (17). Essa assimetria, entre avanço tecnológico e vazio regulatório, constitui risco adicional para a integridade da prova pericial.

Outro aspecto relevante e a exclusão invisível. Modelos treinados com grandes volumes de dados refletem padrões majoritários. Casos atípicos — frequentemente presentes na prática pericial, como doenças raras, quadros multifatoriais ou situações clínicas incomuns, tendem a ser sub-representados. Essa exclusão não é explícita, mas estrutural.

O problema central, portanto, deixa de ser o erro simples e passa a ser o erro plausível, coerente, estrutural e invisível.
O principal desafio contemporâneo não reside apenas na qualidade do argumento, mas na integridade do ponto de partida. Antes da argumentação, há a construção da realidade. Nesse nível pré-argumentativo, podem ocorrer descontextualização, seleção parcial de evidências e meias verdades. A IA acrescenta uma camada adicional de complexidade, pois a própria base informacional pode estar estruturalmente comprometida.

O trabalho recente de Han et al. não se limita a descrever fenômenos conhecidos como “alucinações” em IA. Trata-se de evidência experimental de natureza mais profunda e preocupante. Os autores demonstram que é possível alterar o conhecimento interno de modelos de linguagem médica por meio da modificação de aproximadamente 1,1% de seus parâmetros, sem prejuízo mensurável do desempenho global do sistema.

Essa intervenção permite a inserção deliberada de informações biomédicas incorretas diretamente na estrutura do modelo, que passam a ser utilizadas como conhecimento legítimo em diferentes contextos. Evidências experimentais demonstram que tais informações não apenas persistem ao longo do tempo, como também são aplicadas em contextos distintos e sob diferentes formulações de pergunta, indicando incorporação efetiva ao sistema cognitivo do modelo.

Particularmente relevante é o fato de que tais distorções são de difícil detecção. Modelos manipulados mantêm desempenho global estável, linguagem tecnicamente adequada e coerência interna, mesmo quando operam sobre premissas incorretas. O erro, portanto, torna-se plausível, sofisticado e operacionalmente invisível.

Nesse contexto, o problema deixa de ser compreendido como falha de geração de texto e passa a ser reconhecido como uma forma de adulteração estrutural do conhecimento. A IA deixa de apenas errar e passa a saber errado — e, mais grave, a raciocinar coerentemente a partir desse erro.

A incorporação da IA no Judiciário brasileiro introduz a mediação algorítmica da prova pericial. A prova deixa de ser apenas produzida e interpretada e passa a ser também organizada, sintetizada e priorizada por sistemas automatizados. Essa mediação amplia a complexidade interpretativa e introduz novos riscos, como priorização seletiva de dados e simplificação indevida de contextos complexos.

Diante desse cenário, propõe-se a ampliação do conceito de erro coerente, definido como a construção de uma conclusão tecnicamente consistente baseada em premissas epistemicamente frágeis. Na era da IA, esse conceito passa a incluir conclusões sustentadas por conhecimento estruturalmente adulterado.

Não se trata mais de corrigir respostas incorretas, mas de reconhecer que, na era da IA, pode-se construir raciocínios perfeitamente coerentes sobre premissas estruturalmente falsas, sem que isso seja imediatamente perceptível.

As implicações são sistêmicas, afetando a perícia médica, o sistema de justiça, seguradoras, pesquisa científica e formulação de políticas públicas. Trata-se de um problema de infraestrutura cognitiva da saúde contemporânea.

5. CONCLUSÃO

A IA não elimina o viés, ela o redistribui, amplifica e o torna menos evidente. A possibilidade de manipulação direta do conhecimento interno dos modelos representa uma mudança epistemológica profunda, na qual o erro pode ser incorporado ao próprio sistema de raciocínio técnico.

Na perícia médica, o desafio não é apenas técnico. E epistemológico: garantir a integridade das premissas que sustentam a decisão, reconhecer os limites da coerência como critério de validade e preservar o julgamento crítico do perito como condição essencial para a confiabilidade da prova judicial.

A IA deve ser compreendida como ferramenta auxiliar que amplia capacidades, mas que não substitui, e que pode comprometer, o raciocínio independente do perito. A vigilância crítica sobre a origem, a integridade e o contexto do conhecimento utilizado constitui, nesse cenário, a principal salvaguarda epistemológica da prova pericial.

Referências bibliográficas

1. Hasanzadeh F, Josephson CB, Waters G, Adedinsewo D, Azizi Z, White JA. Bias recognition and mitigation strategies in artificial intelligence healthcare applications. NPJ Digit Med. 2025 Mar 11;8(1):154.
2. Vicente L, Matute H. Humans inherit artificial intelligence biases. Sci Rep. 2023 Oct 3;13(1):15737.
3. Pearson J, Dror IE, Jayes E, Whordley GR, Mason G, Nightingale S. Examining human reliance on artificial intelligence in decision making. Sci Rep. 2026 Feb 5;16(1):5345.
4. Han T, Nebelung S, Khader F, Wang T, Müller-Franzes G, Kuhl C, et al. Medical large language models are susceptible to targeted misinformation attacks. NPJ Digit Med. 2024 Oct 23;7(1):288.
5. Ledley RS, lusted LB. Reasoning foundations of medical diagnosis; symbolic logic, probability, and value theory aid our understanding of how physicians reason. Science. 1959 Jul 3;130(3366):9-21.
6. Shortliffe EH. Computer-based medical consultations: MYCIN. New York: Elsevier; 1976. 263 p.
7. Esteva A, Kuprel B, Novoa RA, Ko J, Swetter SM, Blau HM, et al. Dermatologist-level classification of skin cancer with deep neural networks. Nature. 2017 Feb 2;542(7639):115-18.
8. Rajpurkar P, Irvin J, Zhu K, Yang B, Mehta H, Duan T, et al. CheXNet: radiologist-level pneumonia detection on chest X-rays with deep learning. arXiv [preprint]. 2017 [cited 2026 May 11]. Available from: https://arxiv.org/abs/1711.05225
9. Topol EJ. High-performance medicine: the convergence of human and artificial intelligence. Nat Med. 2019 Jan;25(1):44-56.
10. McKinney SM, Sieniek M, Godbole V, Godwin J, Antropova N, Ashrafian H, et al. International evaluation of an AI system for breast cancer screening. Nature. 2020 Jan;577(7788):89-94.
11. Singhal K, Azizi S, Tu T, Mahdavi SS, Wei J, Chung HW, et al. Large language models encode clinical knowledge. Nature. 2023 Aug;620(7972):172-80.
12. Lee P, Bubeck S, Petro J. Benefits, Limits, and Risks of GPT-4 as an AI Chatbot for Medicine. N Engl J Med. 2023 Mar 30;388(13):1233-9.
13. McIntyre L. Post-truth. Cambridge (MA): MIT Press; 2018. 240 p.
14. Arendt H. Truth and politics. New York: Viking; 1968. Chapter 1, Truth and politics.
15. Social Issues Research Centre, Royal Society, Royal Institution of Great Britain. Guidelines on science and health communication. 1st ed. Oxford: SIRC; 2001. 8 p.
16. Graham P. How to disagree [Internet]. Weymouth: PaulGraham. [2008] – [cited 2026 Mar 10]. Available from: http://www.paulgraham.com/disagree.html
17. Conselho Nacional de Justiça. Mecanismos de inteligência artificial poderão apoiar decisões judiciais em saúde [Internet]. Brasília (DF): CNJ. [2025] – [cited 2026 Mar 20]. Available from: https://www.cnj.jus.br/mecanismos-de-inteligencia-artificial-poderao-apoiar-decisoes-judiciais-em-saude/
18. Barros TTD, Motta MVD, Muñoz D. Inteligência artificial na medicina legal e perícia médica brasileira: inovação tecnológica em meio à ausência de regulamentação específica. Persp Med Legal Pericia Med. 2026;11:260208.