Why does the AI sometimes make things up?

Large language models predict probable text, not verified truth. They fill plausible-sounding gaps when they don’t have grounded information — a confident-sounding answer that has no real basis. This isn’t lying (the model has no agenda); it’s the model not having a separate “truth” component to check itself against. Newer guardrails reduce this but don’t eliminate it.

Is hallucination dangerous in coaching?

Usually low stakes when the topic is reflective — naming feelings, exploring patterns, rehearsing conversations. Higher stakes when the topic involves medical, legal, or financial specifics where a wrong answer translates into a wrong action. Match your verification effort to the stakes: a feeling about a coworker doesn’t need fact-checking; a claim about a drug interaction does.

How can I tell when the AI is fabricating?

Confident answers in narrow domains are the biggest tell — niche conditions, regional regulations, specific therapists by name. Citations you can’t verify, “studies” without findable URLs, and medical specifics with no caveats also rate higher suspicion. The cleaner and more polished the language, the more verification it deserves; fluency is not accuracy.

Should I fact-check what the AI tells me?

For anything actionable in real life — yes. Fact-checking takes 30 seconds with a search engine. For reflective conversation about your own experience, it matters less because you’re the source of truth. The split is roughly: external claims (numbers, citations, regulations) need verification; internal exploration (what you’re feeling, what you want to try) does not.

Are some AI coaches more accurate than others?

Accuracy varies by underlying model, the guardrails the product wraps around it, and how narrowly the coach is scoped. Coaches grounded in well-studied evidence-based methods (CBT, ACT, PDT) tend to drift less than free-form coaches because the source material is structured and well-mapped. Verke’s coaches are scoped by method for exactly this reason.

Verke Editorial

¿Puede la IA alucinar y dar malos consejos? Sí — cómo detectarlo y manejarlo

Verke Editorial · April 28, 2026

¿Puede la IA alucinar y dar malos consejos? Sí. Los modelos grandes de lenguaje a veces fabrican cosas que suenan plausibles: un estudio que no existe, una cita equivocada, un consejo que no aplica a tu situación, un marco conceptual que suena seguro pero está completamente inventado. El coaching implica menos riesgo que un contexto médico o legal, pero un mal consejo sigue siendo un problema. La versión honesta de este artículo es que las salvaguardas reducen las alucinaciones pero no las eliminan, y la propia calibración del usuario es parte de cómo una herramienta de coaching con IA bien diseñada se mantiene útil.

El artículo recorre dónde aparecen las alucinaciones, cómo está diseñado Verke para captar las categorías de mayor riesgo y cómo calibrar tu confianza como usuario, que en pocas palabras es "trata las sugerencias de la IA como el consejo de un amigo inteligente que no lo sabe todo". La postura de Verke es preferir un "no estoy seguro" antes que un "seguro pero equivocado", y mantener el coaching enfocado en la exploración, no en el diagnóstico. Nada de eso vuelve imposibles las alucinaciones. Sí vuelve reconocibles los modos de fallo y sencillos los pasos de recuperación.

Qué significa "alucinación"

Cómo fabrican cosas los modelos de lenguaje

Un modelo de lenguaje predice el texto siguiente más probable a partir de patrones en sus datos de entrenamiento. La mayoría de las veces, el texto siguiente más probable también es el correcto: por eso estas herramientas funcionan tan bien como funcionan. Pero a veces el texto más probable es incorrecto. El modelo produce una respuesta que suena segura y no tiene base real. Lo que confunde a la gente es la fluidez: la respuesta equivocada se lee igual de pulida que una correcta, porque el trabajo del modelo es producir texto fluido, no texto verificado.

Esto no es mentir: el modelo no tiene agenda, ni objetivo, ni intención de engañar. Es que el modelo no tiene un componente separado de "verdad" que contraste lo que produce con la realidad antes de mostrarlo. Las técnicas más nuevas (recuperación, uso de herramientas, chequeos de coherencia, entrenamiento para rechazar) reducen las alucinaciones de forma significativa, y la tasa sigue bajando con cada generación de modelos. No las eliminan, eso sí. Tratar la salida de la IA como "casi siempre correcta, pero verifica las partes que tienen mucho en juego" es la calibración correcta hoy y, probablemente, durante varios años más.

¿Dudas si confiar en el consejo que estás recibiendo?

Prueba un ejercicio de TCC con Judith — 2 minutos, sin email.

Chatea con Judith →

Dónde aparece la alucinación en el coaching

Citas inventadas

La forma clásica de la alucinación: "un estudio de Harvard de 2019 encontró que…" seguido de un hallazgo que suena seguro y, cuando lo buscas, no existe. El paper está inventado; los autores también; el nombre de la revista puede ser real, pero el paper no. La solución es verificar cualquier cita que te importe en PubMed o Google Académico antes de apoyarte en ella. Si incluye una URL, ábrela y comprueba que el resumen diga lo que se afirmó: a veces la URL es real pero el resumen adjunto es incorrecto.

Consejo médico o legal específico

Dosis, interacciones de medicamentos, regulaciones jurisdiccionales, procedimientos legales específicos: cualquier cosa donde la respuesta tenga que ser exactamente correcta o cause daño. Aunque por casualidad el modelo acierte, es la herramienta equivocada para estas preguntas, porque tú no tienes forma de saber si esta vez tuvo razón. Verifica siempre con un profesional licenciado (médico, farmacéutico, abogado, contador) cualquier cosa accionable en esos dominios. Los coaches de Verke están diseñados para rechazar estas preguntas de plano en lugar de improvisar: mira la siguiente sección.

Respuestas seguras en dominios estrechos

Condiciones poco comunes con pocos datos de entrenamiento, regulaciones regionales que al resto del mundo le dan igual, terapeutas específicos por nombre, comunidades profesionales pequeñas. El modelo tiene apenas el patrón suficiente en los datos para producir algo fluido, pero no para saber si es correcto. La combinación de fluidez y nicho es la señal principal: cuando el tema es oscuro pero la respuesta es segura, ahí es donde toca activar la calibración.

Marcos plausibles pero falsos

"Métodos en cinco pasos" y "los cuatro pilares de…" inventados que no existen en la literatura. El modelo ha visto suficiente estructura tipo libro de autoayuda como para producir versiones convincentes, incluso cuando el marco específico que describe está inventado. Si un marco importa para la decisión que estás tomando, busca el autor o el nombre del método para confirmar que es real antes de tratarlo como práctica estándar. Los marcos reales tienen páginas de Wikipedia, libros y citas reales; los inventados, no.

Qué hacemos al respecto

Qué hace Verke al respecto

Salvaguardas por dominio

Los coaches están diseñados para rechazar las categorías de alto riesgo en lugar de improvisar. Dosis médicas, interacciones de medicamentos, opiniones legales, afirmaciones diagnósticas, cualquier cosa que cruce a territorio profesional licenciado: la respuesta es redirigir, no intentarlo. "Eso suena a una pregunta para un farmacéutico" es una característica, no una limitación. El producto prefiere no responder antes que responder mal.

Disciplina de citación

Cuando un coach hace referencia a un estudio o a un método, la cita incluye una URL real que el usuario puede verificar (el artículo StopOverthinking de este sitio cita a A-Tjak et al. 2015 con un enlace a PubMed exactamente por esto: el lector debe poder hacer clic y comprobar). Si el coach no puede citar algo de forma verificable, el encuadre cambia a "hay evidencia de que" o "este es un patrón común en el campo", no a especificidades inventadas. La regla es: "un lector debería poder verificar esto en 30 segundos".

Valores por defecto conservadores

Cuando aparecen señales de gravedad en la conversación, el movimiento por defecto es derivar a atención clínica en lugar de improvisar ayuda. Los temas cercanos a una crisis se enrutan a recursos de crisis. Los temas cercanos al diagnóstico se enrutan a un clínico. El producto está diseñado para errar del lado de "por favor, lleva esto a un humano" cuando hay mucho en juego, que es justo donde una alucinación haría más daño si se colara.

Qué puedes hacer tú como usuario

La calibración es trabajo compartido. El producto pone su parte con salvaguardas y disciplina de citación; tú pones la tuya con un par de hábitos sencillos que abaratan mucho el costo cuando aparece una alucinación:

Trata las sugerencias de la IA como el consejo de un amigo inteligente que no lo sabe todo. Buen punto de partida, no la última palabra.
Verifica las citas antes de compartirlas o de actuar a partir de ellas. PubMed y Google Académico son chequeos de 30 segundos.
Pregunta "¿qué tan seguro estás de esto?": los modelos a veces pueden señalar incertidumbre cuando se les pide, y la respuesta es informativa.
Para cualquier asunto médico, legal o financiero, verifícalo con un humano licenciado. La IA es la herramienta equivocada como fuente principal en esos dominios.
Cuando algo no encaje con tu situación, dilo. La respuesta se va a recalibrar a partir de lo que sumes: un consejo genérico suele ser señal de que el coach todavía no entendió bien las particularidades.

Cuándo buscar más ayuda

La autoayuda y el coaching con IA pueden hacer mucho, pero tienen límites. Si estás atravesando una depresión severa que no cede, ataques de pánico que interrumpen tu día a día, pensamientos de hacerte daño, procesamiento activo de un trauma o dependencia de sustancias, esas son señales para trabajar con un profesional clínico licenciado, no para insistir más con una herramienta de coaching. Puedes encontrar opciones económicas en opencounseling.com o líneas de ayuda internacionales en findahelpline.com. No hay premio por esperar más de lo necesario.

Empieza con Judith

La calibración —"¿este pensamiento (o este consejo) es realmente preciso?"— está en el corazón de la TCC. El enfoque de Judith trata las creencias como hipótesis para poner a prueba, no como hechos para tragar; esa es exactamente la postura que te permite usar cualquier fuente de información (incluido un coach de IA) sin confiar de más. También es buena en la versión meta: nota cuándo te estás apoyando demasiado en una sola fuente —libro, podcast, amigo, app— y te devuelve a tu propio criterio como filtro final. Para más sobre el método, mira Terapia Cognitivo-Conductual.

Prueba un ejercicio de TCC con Judith — sin necesidad de cuenta

Lecturas relacionadas

Preguntas frecuentes

¿Por qué la IA a veces se inventa cosas?

Los modelos grandes de lenguaje predicen texto probable, no verdad verificada. Rellenan vacíos de forma plausible cuando no tienen información sólida: una respuesta que suena segura sin base real. No es mentir (el modelo no tiene agenda); es que el modelo no tiene un componente separado de "verdad" con el que contrastarse. Las salvaguardas más nuevas reducen esto, pero no lo eliminan.

¿Es peligrosa la alucinación en el coaching?

El riesgo suele ser bajo cuando el tema es reflexivo: nombrar emociones, explorar patrones, ensayar conversaciones. Es más alto cuando el tema entra en cuestiones médicas, legales o financieras donde una respuesta equivocada se traduce en una acción equivocada. Ajusta la verificación al riesgo: una sensación sobre un compañero de trabajo no necesita verificarse; una afirmación sobre la interacción de un medicamento, sí.

¿Cómo me doy cuenta de cuándo la IA está inventando?

Las respuestas seguras en dominios muy específicos son la señal más clara: condiciones poco comunes, regulaciones regionales, terapeutas concretos por nombre. Las citas que no se pueden verificar, los "estudios" sin URL localizable y los detalles médicos sin matices también merecen más sospecha. Cuanto más pulido y limpio sea el lenguaje, más verificación merece: la fluidez no es precisión.

¿Debería verificar lo que la IA me dice?

Para cualquier cosa accionable en la vida real, sí. Verificar un dato lleva 30 segundos en un buscador. Para una conversación reflexiva sobre tu propia experiencia importa menos, porque tú eres la fuente. La división, en líneas generales: las afirmaciones externas (números, citas, regulaciones) necesitan verificación; la exploración interna (lo que sientes, lo que quieres probar) no.

¿Algunos coaches de IA son más precisos que otros?

La precisión varía según el modelo de base, las salvaguardas que el producto pone alrededor y qué tan acotado esté el coach. Los coaches anclados en métodos con buena evidencia (TCC, ACT, PDT) tienden a desviarse menos que los coaches de tema libre, porque el material de origen está estructurado y bien mapeado. Los coaches de Verke están acotados por método justamente por esto.

Verke ofrece coaching, no terapia ni atención médica. Los resultados varían según la persona. Si estás en crisis, llama al 988 (España), 116 123 (Reino Unido/UE, Samaritans), o a tus servicios locales de emergencia. Visita findahelpline.com para recursos internacionales.