DefinedTerm · Glossário
O que é alucinação de um LLM
Alucinação LLM é o fenômeno pelo qual um modelo de linguagem grande gera conteúdo gramaticalmente correto e plausível, mas factualmente incorreto, não verificável ou contraditório com a realidade. Classifica-se em alucinação de faticidade (o modelo afirma algo falso) e alucinação de fidelidade (o modelo ignora ou contradiz o contexto). É a limitação estrutural mais relevante para avaliar a confiabilidade dos motores de busca generativos e das fontes que eles citam.
Definição ampliada
A alucinação de um LLM (do inglês hallucination) é a geração de texto que parece coerente e bem formado, mas contém informação falsa, não verificável ou internamente contraditória. O termo vem da psicologia, onde designa a percepção de algo inexistente; aplicado a modelos de linguagem, descreve o mesmo fenômeno: o modelo produz com confiança afirmações que não têm base em fatos reais nem no contexto fornecido.
A taxonomia mais difundida na literatura acadêmica (Zhang et al., ACM TOIS, 2025) distingue duas categorias principais:
Alucinação de faticidade. O modelo afirma algo que contradiz fatos verificáveis do mundo real. Pode se manifestar como contradição factual direta (afirmar dados incorretos sobre uma empresa real) ou como fabricação factual (inventar um estudo, uma citação ou um dado estatístico que não existe).
Alucinação de fidelidade. O modelo desvia sua resposta do contexto ou instrução fornecidos. Subdivide-se em inconsistência de instrução (ignorar parte da instrução do usuário), inconsistência de contexto (contradizer informação incluída no prompt) e inconsistência lógica (gerar raciocínios que se contradizem internamente).
Por que importa em 2026
A alucinação é a limitação que mais compromete a confiança nos motores generativos para decisões de compra ou contratação. Um usuário que pergunta sobre empresas de reformas ou eletricistas em sua cidade pode receber referências a empresas inexistentes, dados de preço fabricados ou certificações inventadas.
Para as empresas que trabalham sua presença na AI search, a alucinação tem uma implicação inversa igualmente relevante: se a informação sobre uma empresa em fontes externas é escassa ou contraditória, o modelo tem maior probabilidade de alucinar ao citá-la, atribuindo-lhe serviços ou localidades incorretos. A clareza de entidade e a cobertura em veículos verificáveis são as principais defesas contra esse risco.
Um estudo publicado na MDPI (2025) que revisa mais de 300 trabalhos de mitigação de alucinações confirma que RAG (Retrieval-Augmented Generation) é a estratégia com maior adoção para reduzir alucinações, ao ancorar as respostas do modelo em fragmentos recuperados de fontes externas verificadas.
Como funciona
As causas da alucinação se distribuem ao longo de todo o ciclo de vida do modelo:
Dados de pré-treinamento. Se o corpus de treinamento contém informação errada, desatualizada ou enviesada, o modelo incorpora esse erro ao seu conhecimento paramétrico. O conhecimento tem ainda uma data de corte: qualquer evento posterior não existe para o modelo, salvo se fornecido via RAG.
Treinamento e ajuste fino. O objetivo de previsão do próximo token favorece a coerência e a fluência em detrimento da veracidade. Durante o ajuste fino com retroalimentação humana (RLHF ou DPO), os avaliadores podem reforçar inadvertidamente respostas plausíveis, mas incorretas.
Inferência. As estratégias de decodificação estocástica com temperatura elevada aumentam a diversidade das respostas, mas também a probabilidade de alucinação. Quando o modelo atinge o limite de seu conhecimento sobre um tema, tende a extrapolar em vez de admitir incerteza.
Diferença com outros erros de IA
| Tipo de erro | Descrição | Exemplo |
|---|---|---|
| Alucinação factual | Afirmação falsa apresentada com confiança | Citar um estudo inexistente |
| Alucinação de fidelidade | Ignorar ou contradizer o contexto dado | Resumir o oposto do que diz o documento |
| Viés | Preferência sistemática por certos grupos | Citar apenas fontes de um idioma ou região |
| Erro de raciocínio | Falha na cadeia lógica, não no fato base | Calcular incorretamente a partir de dados corretos |
| Desatualização | Informação correta em seu momento, mas obsoleta | Citar legislação vigente que foi revogada |
A diferença mais relevante para usuários de AI search é que a alucinação é apresentada com o mesmo tom de confiança que a informação correta, sem sinal visível de incerteza. Isso a distingue de um simples erro de cálculo, em que o modelo pode reconhecer a dúvida, e explica por que os mecanismos de RAG e citação explícita são necessários em sistemas de alta confiabilidade.
Termos relacionados
RAG (Retrieval-Augmented Generation), Citabilidade LLM, Share of Voice IA.
Fuentes
Términos relacionados
- rag-retrieval-augmented-generation
- citabilidade-llm
- share-of-voice-ia