DefinedTerm · Glosario
Qué es la alucinación de un LLM
Alucinación LLM es el fenómeno por el que un modelo de lenguaje grande genera contenido gramaticalmente correcto y plausible pero factualmente incorrecto, no verificable o contradictorio con la realidad. Se clasifica en alucinación de facticidad (el modelo afirma algo falso) y alucinación de fidelidad (el modelo ignora o contradice el contexto). Es la limitación estructural más relevante para evaluar la fiabilidad de los motores de búsqueda generativos y de las fuentes que citan.
Definición ampliada
La alucinación de un LLM (del inglés hallucination) es la generación de texto que parece coherente y bien formado pero contiene información falsa, no verificable o internamente contradictoria. El término proviene de la psicología, donde designa la percepción de algo inexistente; aplicado a modelos de lenguaje, describe el mismo fenómeno: el modelo produce con confianza aserciones que no tienen base en hechos reales ni en el contexto proporcionado.
La taxonomía más extendida en la literatura académica (Zhang et al., ACM TOIS, 2025) distingue dos categorías principales:
Alucinación de facticidad. El modelo afirma algo que contradice hechos verificables del mundo real. Puede manifestarse como contradicción factual directa (afirmar datos incorrectos sobre una empresa real) o como fabricación factual (inventar un estudio, una cita o un dato estadístico que no existe).
Alucinación de fidelidad. El modelo desvía su respuesta del contexto o instrucción proporcionados. Se subdivide en inconsistencia de instrucción (ignorar parte de la instrucción del usuario), inconsistencia de contexto (contradecir información incluida en el prompt) e inconsistencia lógica (generar razonamientos que se contradicen internamente).
Por qué importa en 2026
La alucinación es la limitación que más compromete la confianza en los motores generativos para decisiones de compra o contratación. Un usuario que pregunta por empresas de reformas o fontaneros en su ciudad puede recibir referencias a empresas inexistentes, datos de precio fabricados o certificaciones inventadas.
Para las empresas que trabajan su presencia en AI search, la alucinación tiene una implicación inversa igualmente relevante: si la información sobre una empresa en fuentes externas es escasa o contradictoria, el modelo tiene mayor probabilidad de alucinar al citarla, atribuyéndole servicios o ubicaciones incorrectas. La claridad de entidad y la cobertura en medios verificables son las principales defensas contra este riesgo.
Un estudio publicado en MDPI (2025) que revisa más de 300 trabajos de mitigación de alucinaciones confirma que RAG (Retrieval-Augmented Generation) es la estrategia con mayor adopción para reducir alucinaciones, al anclar las respuestas del modelo en fragmentos recuperados de fuentes externas verificadas.
Cómo funciona
Las causas de la alucinación se distribuyen a lo largo de todo el ciclo de vida del modelo:
Datos de preentrenamiento. Si el corpus de entrenamiento contiene información errónea, desactualizada o sesgada, el modelo incorpora ese error a su conocimiento paramétrico. El conocimiento tiene además una fecha de corte: cualquier evento posterior no existe para el modelo salvo que se le proporcione mediante RAG.
Entrenamiento y ajuste fino. El objetivo de predicción del siguiente token favorece la coherencia y fluidez sobre la veracidad. Durante el ajuste fino con retroalimentación humana (RLHF o DPO), los evaluadores pueden reforzar involuntariamente respuestas plausibles pero incorrectas.
Inferencia. Las estrategias de decodificación estocástica con temperatura alta aumentan la diversidad de las respuestas pero también la probabilidad de alucinación. Cuando el modelo alcanza el límite de su conocimiento sobre un tema, tiende a extrapolar en lugar de admitir incertidumbre.
Diferencia con otros errores de IA
| Tipo de error | Descripción | Ejemplo |
|---|---|---|
| Alucinación factual | Afirmación falsa presentada con confianza | Citar un estudio inexistente |
| Alucinación de fidelidad | Ignorar o contradecir el contexto dado | Resumir el contrario de lo que dice el documento |
| Sesgo | Preferencia sistemática por ciertos grupos | Citar solo fuentes de un idioma o región |
| Error de razonamiento | Fallo en la cadena lógica, no en el hecho base | Calcular incorrectamente a partir de datos correctos |
| Desactualización | Información correcta en su momento pero obsoleta | Citar legislación vigente que fue derogada |
La diferencia más relevante para usuarios de AI search es que la alucinación se presenta con el mismo tono de confianza que la información correcta, sin señal visible de incertidumbre. Esto la distingue de un simple error de cálculo, donde el modelo puede reconocer la duda, y explica por qué los mecanismos de RAG y citación explícita son necesarios para sistemas de alta fiabilidad.
Términos relacionados
RAG (Retrieval-Augmented Generation), Citabilidad LLM, Fan-out query.
Fuentes
Términos relacionados
- rag-retrieval-augmented-generation
- citabilidad-llm
- fan-out-query