Pular para o conteúdo
Made For Builders iconoMade For Builders

DefinedTerm · Glossário

O que é alucinação de um LLM

Alucinação LLM é o fenômeno pelo qual um modelo de linguagem grande gera conteúdo gramaticalmente correto e plausível, mas factualmente incorreto, não verificável ou contraditório com a realidade. Classifica-se em alucinação de faticidade (o modelo afirma algo falso) e alucinação de fidelidade (o modelo ignora ou contradiz o contexto). É a limitação estrutural mais relevante para avaliar a confiabilidade dos motores de busca generativos e das fontes que eles citam.

edu-lopez-paradaPublicado Actualizado

Definição ampliada

A alucinação de um LLM (do inglês hallucination) é a geração de texto que parece coerente e bem formado, mas contém informação falsa, não verificável ou internamente contraditória. O termo vem da psicologia, onde designa a percepção de algo inexistente; aplicado a modelos de linguagem, descreve o mesmo fenômeno: o modelo produz com confiança afirmações que não têm base em fatos reais nem no contexto fornecido.

A taxonomia mais difundida na literatura acadêmica (Zhang et al., ACM TOIS, 2025) distingue duas categorias principais:

Alucinação de faticidade. O modelo afirma algo que contradiz fatos verificáveis do mundo real. Pode se manifestar como contradição factual direta (afirmar dados incorretos sobre uma empresa real) ou como fabricação factual (inventar um estudo, uma citação ou um dado estatístico que não existe).

Alucinação de fidelidade. O modelo desvia sua resposta do contexto ou instrução fornecidos. Subdivide-se em inconsistência de instrução (ignorar parte da instrução do usuário), inconsistência de contexto (contradizer informação incluída no prompt) e inconsistência lógica (gerar raciocínios que se contradizem internamente).

Por que importa em 2026

A alucinação é a limitação que mais compromete a confiança nos motores generativos para decisões de compra ou contratação. Um usuário que pergunta sobre empresas de reformas ou eletricistas em sua cidade pode receber referências a empresas inexistentes, dados de preço fabricados ou certificações inventadas.

Para as empresas que trabalham sua presença na AI search, a alucinação tem uma implicação inversa igualmente relevante: se a informação sobre uma empresa em fontes externas é escassa ou contraditória, o modelo tem maior probabilidade de alucinar ao citá-la, atribuindo-lhe serviços ou localidades incorretos. A clareza de entidade e a cobertura em veículos verificáveis são as principais defesas contra esse risco.

Um estudo publicado na MDPI (2025) que revisa mais de 300 trabalhos de mitigação de alucinações confirma que RAG (Retrieval-Augmented Generation) é a estratégia com maior adoção para reduzir alucinações, ao ancorar as respostas do modelo em fragmentos recuperados de fontes externas verificadas.

Como funciona

As causas da alucinação se distribuem ao longo de todo o ciclo de vida do modelo:

Dados de pré-treinamento. Se o corpus de treinamento contém informação errada, desatualizada ou enviesada, o modelo incorpora esse erro ao seu conhecimento paramétrico. O conhecimento tem ainda uma data de corte: qualquer evento posterior não existe para o modelo, salvo se fornecido via RAG.

Treinamento e ajuste fino. O objetivo de previsão do próximo token favorece a coerência e a fluência em detrimento da veracidade. Durante o ajuste fino com retroalimentação humana (RLHF ou DPO), os avaliadores podem reforçar inadvertidamente respostas plausíveis, mas incorretas.

Inferência. As estratégias de decodificação estocástica com temperatura elevada aumentam a diversidade das respostas, mas também a probabilidade de alucinação. Quando o modelo atinge o limite de seu conhecimento sobre um tema, tende a extrapolar em vez de admitir incerteza.

Diferença com outros erros de IA

Tipo de erroDescriçãoExemplo
Alucinação factualAfirmação falsa apresentada com confiançaCitar um estudo inexistente
Alucinação de fidelidadeIgnorar ou contradizer o contexto dadoResumir o oposto do que diz o documento
ViésPreferência sistemática por certos gruposCitar apenas fontes de um idioma ou região
Erro de raciocínioFalha na cadeia lógica, não no fato baseCalcular incorretamente a partir de dados corretos
DesatualizaçãoInformação correta em seu momento, mas obsoletaCitar legislação vigente que foi revogada

A diferença mais relevante para usuários de AI search é que a alucinação é apresentada com o mesmo tom de confiança que a informação correta, sem sinal visível de incerteza. Isso a distingue de um simples erro de cálculo, em que o modelo pode reconhecer a dúvida, e explica por que os mecanismos de RAG e citação explícita são necessários em sistemas de alta confiabilidade.

Termos relacionados

RAG (Retrieval-Augmented Generation), Citabilidade LLM, Share of Voice IA.

Fuentes

Términos relacionados

  • rag-retrieval-augmented-generation
  • citabilidade-llm
  • share-of-voice-ia