Why does the AI sometimes make things up?

Large language models predict probable text, not verified truth. They fill plausible-sounding gaps when they don’t have grounded information — a confident-sounding answer that has no real basis. This isn’t lying (the model has no agenda); it’s the model not having a separate “truth” component to check itself against. Newer guardrails reduce this but don’t eliminate it.

Is hallucination dangerous in coaching?

Usually low stakes when the topic is reflective — naming feelings, exploring patterns, rehearsing conversations. Higher stakes when the topic involves medical, legal, or financial specifics where a wrong answer translates into a wrong action. Match your verification effort to the stakes: a feeling about a coworker doesn’t need fact-checking; a claim about a drug interaction does.

How can I tell when the AI is fabricating?

Confident answers in narrow domains are the biggest tell — niche conditions, regional regulations, specific therapists by name. Citations you can’t verify, “studies” without findable URLs, and medical specifics with no caveats also rate higher suspicion. The cleaner and more polished the language, the more verification it deserves; fluency is not accuracy.

Should I fact-check what the AI tells me?

For anything actionable in real life — yes. Fact-checking takes 30 seconds with a search engine. For reflective conversation about your own experience, it matters less because you’re the source of truth. The split is roughly: external claims (numbers, citations, regulations) need verification; internal exploration (what you’re feeling, what you want to try) does not.

Are some AI coaches more accurate than others?

Accuracy varies by underlying model, the guardrails the product wraps around it, and how narrowly the coach is scoped. Coaches grounded in well-studied evidence-based methods (CBT, ACT, PDT) tend to drift less than free-form coaches because the source material is structured and well-mapped. Verke’s coaches are scoped by method for exactly this reason.

Verke Editorial

A IA pode alucinar conselhos ruins? Sim — veja como identificar e lidar

Verke Editorial · April 28, 2026

A IA pode alucinar conselhos ruins? Sim. Modelos de linguagem grandes ocasionalmente inventam coisas que soam plausíveis — um estudo que não existe, uma citação errada, um conselho que não se aplica à sua situação, um framework que parece sólido mas é genuinamente inventado. Os contextos de coaching têm consequências menos graves do que os contextos médicos ou jurídicos, mas conselho ruim ainda importa. A versão honesta deste artigo é que as proteções reduzem a alucinação mas não eliminam, e a calibração do próprio usuário faz parte do que mantém uma ferramenta de coaching com IA bem útil.

O artigo passa por onde a alucinação aparece, como a Verke é desenhada para pegar as categorias de mais risco e como calibrar sua confiança como usuário — algo como "trate as sugestões da IA como conselho de um amigo inteligente que não é onisciente". A postura da Verke é preferir "não tenho certeza" a confiante-e-errado, e manter o coaching voltado para a exploração, não para o diagnóstico. Nada disso torna a alucinação impossível. Mas torna os modos de falha reconhecíveis e a recuperação fácil.

O que "alucinação" significa

Como modelos de linguagem inventam coisas

Um modelo de linguagem prevê qual texto provavelmente vem em seguida a partir de padrões nos dados em que foi treinado. Na maior parte das vezes, o texto mais provável é também o texto correto — é por isso que essas ferramentas funcionam tão bem. Às vezes, porém, o texto mais provável está errado. O modelo produz uma resposta que soa confiante e não tem base na realidade. A fluência é o que confunde: a resposta errada lê tão bem quanto a certa, porque o trabalho do modelo é gerar texto fluente, não texto verificado.

Isso não é mentira — o modelo não tem agenda, não tem objetivo, não tenta enganar. É o modelo não ter um componente separado de "verdade" que cheque a saída contra a realidade antes de produzir. Técnicas mais novas (recuperação, uso de ferramentas, checagens de auto-consistência, treino para recusar) reduzem a alucinação de forma significativa, e a taxa segue caindo a cada geração de modelo. Não eliminam, no entanto. Tratar a saída da IA como "majoritariamente certa, mas confira as partes de alto risco" é a calibração certa hoje e provavelmente pelos próximos vários anos.

Em dúvida se pode confiar no conselho que está recebendo?

Faça um exercício de TCC com Judith — 2 minutos, sem e-mail.

Converse com Judith →

Onde a alucinação aparece no coaching

Citações inventadas

O formato clássico da alucinação: "um estudo de Harvard de 2019 descobriu que…" seguido de uma conclusão de aparência confiante que, quando você vai procurar, não existe. O paper é inventado; os autores são inventados; o nome da revista pode até ser real, mas o paper não. A solução é verificar qualquer citação que importe para você via PubMed ou Google Acadêmico antes de se basear nela. Se vier uma URL, clique e confira se o abstract de fato diz o que foi alegado — às vezes a URL é real, mas o resumo atrelado a ela está errado.

Conselho médico ou jurídico específico

Doses, interações medicamentosas, regulações por jurisdição, procedimentos jurídicos específicos — qualquer coisa em que a resposta precisa estar exatamente certa ou causa dano. Mesmo quando a resposta do modelo está correta por acaso, é a ferramenta errada para essas perguntas, porque não tem como você saber se ela acertou desta vez. Sempre confirme com um profissional licenciado (médico, farmacêutico, advogado, contador) para qualquer coisa acionável nesses domínios. Os coaches da Verke são feitos para recusar essas perguntas de cara em vez de improvisar — veja a próxima seção.

Respostas confiantes em domínios estreitos

Condições raras com poucos dados de treino, regulações regionais que a maior parte do mundo não conhece, terapeutas específicos pelo nome, comunidades profissionais pequenas. O modelo tem padrão suficiente nos dados para produzir algo fluente, mas não o bastante para saber se está certo. A combinação de fluência com estreiteza é o sinal principal — quando o assunto é obscuro mas a resposta é confiante, é hora de a calibração entrar.

Frameworks plausíveis mas errados

"Métodos de cinco passos" e "quatro pilares de…" inventados, que não existem na literatura. O modelo viu estrutura suficiente em livros de autoajuda para produzir versões convincentes disso, mesmo quando o framework específico que descreve é inventado. Se um framework é importante para a decisão que você está tomando, procure o autor ou o nome do método para confirmar que existe antes de tratá-lo como prática consagrada. Frameworks reais têm página da Wikipédia, livros e citações reais; os inventados, não.

O que fazemos quanto a isso

O que a Verke faz quanto a isso

Proteções de domínio

Os coaches são feitos para recusar as categorias de mais risco em vez de improvisar. Dosagem médica, interações medicamentosas, opinião jurídica, alegações diagnósticas, qualquer coisa que entre em terreno de profissional licenciado — a resposta é redirecionar, não tentar. "Isso parece pergunta para farmacêutico" é uma característica, não uma limitação. O produto prefere não responder a responder errado.

Disciplina nas citações

Quando um coach faz referência a um estudo ou método, a citação inclui uma URL real que o usuário pode verificar (o artigo sobre Parar de Ruminar deste site cita A-Tjak et al. 2015 com link do PubMed exatamente por isso — o leitor deveria poder clicar e conferir). Se o coach não consegue citar algo de forma verificável, o enquadramento muda para "há evidências de que" ou "esse é um padrão comum na área", e não para específicos inventados. A régua é "um leitor consegue verificar isso em 30 segundos."

Padrões conservadores

Quando a gravidade é sugerida na conversa, o movimento padrão é trazer à tona o cuidado clínico em vez de improvisar ajuda. Tópicos próximos de crise são roteados para recursos de crise. Tópicos próximos de diagnóstico vão para um clínico. O produto é feito para errar do lado de "por favor, leve isso para um humano" quando o risco é alto — que é onde a alucinação faria mais estrago se passasse.

O que você pode fazer como usuário

Calibração é um trabalho compartilhado. O produto cumpre sua parte com proteções e disciplina nas citações; a sua parte são alguns hábitos simples que tornam a alucinação muito menos custosa quando acontece:

Trate as sugestões da IA como conselho de um amigo inteligente que não é onisciente. Bom ponto de partida, não palavra final.
Verifique citações antes de compartilhar ou agir com base nelas. PubMed e Google Acadêmico são checagens de 30 segundos.
Pergunte "quão seguro você está disso?" — modelos às vezes conseguem sinalizar incerteza quando provocados, e a resposta é informativa.
Para qualquer coisa médica, jurídica ou financeira — confirme com um humano licenciado. A IA é a ferramenta errada para esses domínios como fonte principal.
Quando algo não bate com a sua situação, conteste. A resposta vai recalibrar com base no que você acrescentou — conselho genérico costuma ser sinal de que o coach ainda não entendeu bem os detalhes.

Quando buscar mais ajuda

Autoajuda e coaching com IA conseguem muita coisa, mas têm limites. Se você está vivendo uma depressão severa que não passa, ataques de pânico que atrapalham o dia a dia, pensamentos de se machucar, processamento ativo de trauma ou dependência química — esses são sinais para buscar um profissional licenciado, não para forçar a barra com uma ferramenta de coaching. Você encontra opções de baixo custo no opencounseling.com ou linhas internacionais de apoio via findahelpline.com. Não tem prêmio por esperar mais do que você precisa.

Trabalhe com a Judith

Calibração — "esse pensamento (ou esse conselho) é mesmo preciso?" — é o coração da TCC. A abordagem da Judith trata crenças como hipóteses para testar, não como fatos para engolir, e essa é exatamente a postura que permite usar qualquer fonte de input (inclusive um coach de IA) sem confiar demais. Ela também é boa na metaversão: percebe quando você está apoiando demais em uma única fonte — livro, podcast, amigo, app — e te traz de volta para o seu próprio juízo como o filtro final. Para saber mais sobre o método, veja Terapia Cognitivo-Comportamental.

Experimente um exercício de TCC com a Judith — sem precisar criar conta

Leituras relacionadas

Perguntas frequentes

Por que a IA às vezes inventa coisas?

Modelos de linguagem grandes preveem texto provável, não verdade verificada. Eles preenchem lacunas que soam plausíveis quando não têm informação fundamentada — uma resposta que soa confiante e não tem base real. Isso não é mentira (o modelo não tem agenda); é o modelo não ter um componente separado de "verdade" para checar a si mesmo. As proteções mais novas reduzem isso mas não eliminam.

A alucinação é perigosa no coaching?

Geralmente de baixo risco quando o assunto é reflexivo — nomear sentimentos, explorar padrões, ensaiar conversas. Risco maior quando o assunto envolve especificidades médicas, jurídicas ou financeiras, em que uma resposta errada vira ação errada. Ajuste o esforço de verificação aos riscos: um sentimento sobre um colega de trabalho não precisa de checagem; uma alegação sobre interação medicamentosa precisa.

Como sei quando a IA está inventando?

Respostas confiantes em domínios estreitos são o maior sinal — condições raras, regulações regionais, terapeutas específicos pelo nome. Citações que você não consegue verificar, "estudos" sem URL localizável e detalhes médicos sem ressalvas também merecem mais suspeita. Quanto mais limpa e polida a linguagem, mais verificação ela merece; fluência não é precisão.

Devo checar o que a IA me diz?

Para qualquer coisa acionável na vida real — sim. Checar fatos leva 30 segundos com um buscador. Para conversa reflexiva sobre a sua própria experiência, importa menos, porque você é a fonte da verdade. A divisão é mais ou menos esta: alegações externas (números, citações, regulações) precisam de verificação; exploração interna (o que você está sentindo, o que quer tentar) não.

Alguns coaches de IA são mais precisos que outros?

A precisão varia conforme o modelo por trás, as proteções que o produto coloca em volta dele e quão delimitado o coach é. Coaches ancorados em métodos baseados em evidência bem estudados (TCC, ACT, PDT) tendem a desviar menos que coaches genéricos porque o material de origem é estruturado e bem mapeado. Os coaches da Verke são delimitados por método justamente por isso.

A Verke oferece coaching, não terapia nem cuidado médico. Resultados variam de pessoa pra pessoa. Se você está em crise, ligue para 988 (US), 116 123 (UK/EU, Samaritans), ou os serviços de emergência locais. Visite findahelpline.com para recursos internacionais.