Why does the AI sometimes make things up?

Large language models predict probable text, not verified truth. They fill plausible-sounding gaps when they don’t have grounded information — a confident-sounding answer that has no real basis. This isn’t lying (the model has no agenda); it’s the model not having a separate “truth” component to check itself against. Newer guardrails reduce this but don’t eliminate it.

Is hallucination dangerous in coaching?

Usually low stakes when the topic is reflective — naming feelings, exploring patterns, rehearsing conversations. Higher stakes when the topic involves medical, legal, or financial specifics where a wrong answer translates into a wrong action. Match your verification effort to the stakes: a feeling about a coworker doesn’t need fact-checking; a claim about a drug interaction does.

How can I tell when the AI is fabricating?

Confident answers in narrow domains are the biggest tell — niche conditions, regional regulations, specific therapists by name. Citations you can’t verify, “studies” without findable URLs, and medical specifics with no caveats also rate higher suspicion. The cleaner and more polished the language, the more verification it deserves; fluency is not accuracy.

Should I fact-check what the AI tells me?

For anything actionable in real life — yes. Fact-checking takes 30 seconds with a search engine. For reflective conversation about your own experience, it matters less because you’re the source of truth. The split is roughly: external claims (numbers, citations, regulations) need verification; internal exploration (what you’re feeling, what you want to try) does not.

Are some AI coaches more accurate than others?

Accuracy varies by underlying model, the guardrails the product wraps around it, and how narrowly the coach is scoped. Coaches grounded in well-studied evidence-based methods (CBT, ACT, PDT) tend to drift less than free-form coaches because the source material is structured and well-mapped. Verke’s coaches are scoped by method for exactly this reason.

Verke Editorial

AI가 잘못된 조언을 만들어 낼 수 있을까? 네 — 알아차리고 대처하는 방법

Verke Editorial · April 28, 2026

AI가 잘못된 조언을 만들어 낼 수 있냐고요? 네. 대형 언어 모델은 가끔 그럴듯하게 들리는 내용을 지어내요 — 실제로 없는 연구, 잘못된 인용, 본인 상황에 맞지 않는 조언, 확신에 찬 말투지만 실은 근거가 없는 프레임워크 같은 것들이요. 코칭 맥락은 의료나 법률보다 위험도가 낮지만, 잘못된 조언은 여전히 문제가 돼요. 이 글의 솔직한 결론은 이래요: 안전장치가 이런 오류를 줄여주지만 완전히 없애지는 못하고, AI 코칭 도구가 유용하게 작동하려면 사용자 본인의 판단력도 중요한 역할을 해요.

이 글에서는 환각이 어디서 발생하는지, Verke가 위험도 높은 유형을 잡아내기 위해 어떻게 설계되었는지, 사용자로서 신뢰 수준을 어떻게 맞추면 좋은지를 안내해요. 기본 자세는 "모든 걸 알지는 못하지만 똑똑한 친구의 조언"처럼 받아들이는 거예요. Verke는 자신 있게 말하면서 틀리는 것보다 "잘 모르겠어요"라고 말하는 쪽을 택하고, 진단이 아닌 탐색에 초점을 맞춘 코칭을 해요. 이것이 환각을 완전히 없애주는 건 아니에요. 하지만 문제가 생겼을 때 알아차리기 쉽고, 대처하기도 쉽게 만들어 줘요.

"환각"이란 무엇인가

언어 모델이 만들어 내는 방식

언어 모델은 학습 데이터의 패턴을 기반으로 다음에 올 가능성이 높은 텍스트를 예측해요. 대부분의 경우 가장 가능성 높은 다음 텍스트가 실제로 맞는 텍스트이기도 해서 이런 도구들이 잘 작동하는 거예요. 하지만 가끔은 가장 가능성 높은 다음 텍스트가 틀릴 때가 있어요. 모델이 사실에 근거하지 않는 자신감 넘치는 답변을 내놓는 거예요. 사람들을 혼란스럽게 하는 건 그 유창함이에요 — 틀린 답변이 맞는 답변만큼 매끄럽게 읽히는데, 모델의 역할은 검증된 텍스트가 아니라 유창한 텍스트를 만드는 것이기 때문이에요.

이건 거짓말이 아니에요 — 모델에는 의도도, 목표도, 속이려는 의지도 없어요. 출력을 내보내기 전에 현실과 대조하는 별도의 "사실 확인" 장치가 모델에 없는 거예요. 최신 기술(검색 연동, 도구 활용, 자기 일관성 검사, 거부 훈련)이 환각 현상을 의미 있게 줄이고 있고, 모델이 새로워질 때마다 그 비율이 계속 낮아지고 있어요. 하지만 완전히 없앨 수는 없어요. AI 출력을 "대부분 맞지만 중요한 부분은 직접 확인하기"로 보는 게 지금, 그리고 앞으로 몇 년간 적절한 기준이에요.

받고 있는 조언을 믿어도 될지 고민되세요?

Judith와 CBT 연습 해보기 — 2분이면 돼요, 이메일 불필요.

Judith와 대화하기 →

코칭에서 환각이 나타나는 경우

만들어진 인용

전형적인 환각은 이런 식이에요: "2019년 하버드 연구에 따르면…" 뒤에 그럴듯한 연구 결과가 이어지는데, 직접 찾아보면 존재하지 않아요. 논문 자체가 지어낸 거고, 저자도 가짜이고, 학술지 이름은 실제일 수 있지만 해당 논문은 없어요. 대처법은 간단해요 — 중요한 인용이라면 PubMed나 Google Scholar에서 꼭 확인하고 나서 활용하세요. URL이 포함되어 있다면 직접 들어가서 초록이 정말 주장된 내용과 맞는지 확인하세요. 가끔 URL은 진짜인데 거기에 붙은 요약이 틀린 경우가 있거든요.

구체적인 의료·법률 조언

약 복용량, 약물 상호작용, 각 지역의 규정, 구체적인 법적 절차 — 답이 정확하지 않으면 피해가 생길 수 있는 모든 질문이 여기에 해당해요. 모델이 우연히 맞는 답을 줄 때도 있지만, 이번에 맞았는지 확인할 방법이 없기 때문에 이런 질문에는 적합하지 않아요. 이 분야에서 실제로 행동에 옮길 일이라면 반드시 전문가(의사, 약사, 변호사, 세무사)에게 확인하세요. Verke 코치는 이런 질문에 임의로 답하지 않고 거절하도록 설계되어 있어요 — 다음 섹션에서 자세히 다뤄요.

좁은 분야에서 확신에 찬 답변

학습 데이터가 부족한 희귀 질환, 대부분의 나라에서 해당되지 않는 특정 지역 규정, 이름으로 검색하는 특정 상담사, 소규모 전문가 커뮤니티 같은 주제예요. 모델이 유창하게 답을 만들어낼 만큼의 패턴은 갖고 있지만, 그게 정확한지 판단할 만큼은 아닌 거예요. 유창함과 좁은 범위의 조합이 핵심 신호예요 — 주제는 생소한데 답변이 자신 있게 나온다면, 그때가 한 발 물러서서 확인해야 할 때예요.

그럴듯해 보이지만 잘못된 틀

실제 문헌에 없는 "5단계 방법론"이나 "4가지 기둥" 같은 프레임워크를 그럴듯하게 만들어 내기도 해요. 자기계발 스타일의 구조를 많이 학습했기 때문에, 존재하지 않는 프레임워크도 진짜처럼 보이게 구성할 수 있어요. 어떤 프레임워크가 중요한 결정에 영향을 준다면, 표준 관행으로 받아들이기 전에 저자나 방법론 이름을 직접 검색해서 실재하는지 확인하세요. 진짜 프레임워크에는 위키피디아 페이지, 관련 서적, 학술 인용이 있지만, 만들어진 것에는 없어요.

이에 대한 Verke의 대응

Verke는 이에 대해 어떻게 하고 있나요

분야별 안전장치

코치는 고위험 주제에 즉흥적으로 답하지 않고 거절하도록 설계되어 있어요. 약 용량, 약물 상호작용, 법적 의견, 진단 관련 주장, 전문 자격이 필요한 영역은 — 답변을 시도하는 대신 적절한 곳으로 안내해요. "그건 약사에게 문의하시는 게 좋겠어요"는 한계가 아니라 의도된 기능이에요. 잘못된 답을 하느니 답하지 않는 쪽을 택한 거예요.

인용 규율

코치가 연구나 방법론을 언급할 때, 인용에는 사용자가 확인할 수 있는 실제 URL이 포함돼요(이 사이트의 반복적 사고 멈추기 글에서 A-Tjak et al. 2015를 PubMed 링크와 함께 인용한 것도 바로 이런 이유예요 — 독자가 클릭해서 확인할 수 있어야 하니까요). 검증 가능한 인용을 할 수 없는 경우에는 지어낸 구체 사항이 아니라 "이에 대한 근거가 있어요" 또는 "이 분야에서 흔히 나타나는 패턴이에요"라는 표현으로 전환해요. 기준은 "독자가 30초 안에 확인할 수 있는가"예요.

보수적 기본값

대화에서 심각한 신호가 감지되면, 기본 대응은 섣불리 도우려 하기보다 전문 상담을 안내하는 거예요. 위기와 관련된 주제는 위기 지원 자원으로, 진단이 필요해 보이는 주제는 전문가에게 연결돼요. 위험이 높은 상황에서는 "이건 전문가와 상의해 주세요"라는 쪽으로 기울도록 설계되어 있어요 — 환각이 슬며시 빠져나갔을 때 가장 큰 피해를 줄 수 있는 바로 그 지점이기도 하니까요.

사용자로서 할 수 있는 것

교정은 함께하는 작업이에요. 제품 쪽에서는 안전장치와 출처 표기 원칙으로 책임을 다하고, 사용자 쪽에서는 잘못된 정보가 나오더라도 큰 문제가 되지 않게 해주는 몇 가지 간단한 습관이 있어요:

AI 제안은 똑똑하지만 만능은 아닌 친구의 조언이라고 생각하세요. 유용한 출발점이지, 최종 답은 아니에요.
인용을 공유하거나 근거로 삼기 전에 확인하세요. PubMed와 Google Scholar로 30초면 돼요.
"이 답변에 대해 얼마나 확신하세요?"라고 물어보세요 — 모델이 불확실성을 표시할 수 있는 경우가 있고, 그 답변 자체가 유용한 정보가 돼요.
의료, 법률, 재무 관련이라면 — 반드시 자격 있는 전문가에게 확인하세요. 이런 영역에서 AI를 1차 정보원으로 쓰는 건 적절하지 않아요.
자신의 상황에 맞지 않는 것이 있으면 반박해 보세요. 코치가 새로 추가된 정보를 반영해서 조정할 거예요 — 일반적인 조언은 보통 코치가 구체적인 상황을 아직 충분히 파악하지 못했다는 신호예요.

더 많은 도움이 필요할 때

자기 돌봄과 AI 코칭으로 많은 걸 할 수 있지만, 한계도 있어요. 오랫동안 나아지지 않는 심한 우울감, 일상을 방해하는 공황 발작, 자해에 대한 생각, 트라우마 처리가 필요한 상황, 물질 의존 — 이런 증상은 코칭 도구를 더 밀어붙이라는 신호가 아니라 전문 상담사의 도움이 필요하다는 신호예요. 부담 적은 상담 옵션은 opencounseling.com 또는 국제 상담 전화를 다음에서 확인하세요: findahelpline.com. 필요 이상으로 오래 기다린다고 좋을 건 없어요.

Judith와 대화하기

교정 — "이 생각(또는 이 조언)이 실제로 맞는 건가?" — 이게 바로 CBT의 핵심이에요. Judith의 접근법은 믿음을 사실로 받아들이는 게 아니라 검증해 볼 가설로 다뤄요. 이 자세가 있으면 AI 코치를 포함해 어떤 정보 출처든 과신하지 않고 활용할 수 있어요. 메타 버전에도 뛰어나요 — 책이든, 팟캐스트든, 친구든, 앱이든 어떤 한 출처에 너무 기대고 있을 때 이를 알아채고, 최종 필터인 자기 자신의 판단력으로 돌아오게 해줘요. 이 방법론에 대해 더 알고 싶다면 인지행동치료(CBT)를 참고하세요.

Judith와 CBT 연습해 보세요 — 계정 없이 바로 시작

자주 묻는 질문

AI가 왜 가끔 없는 이야기를 하나요?

대형 언어 모델은 검증된 진실이 아니라 확률적으로 그럴듯한 텍스트를 예측해요. 근거 있는 정보가 없으면 그럴듯하게 들리는 빈칸을 채우는 거예요 — 실제 근거 없는 자신감 넘치는 답변이요. 이건 거짓말이 아니에요(모델에는 의도가 없으니까). 모델에 출력물을 현실과 대조하는 별도의 "진실" 장치가 없는 거예요. 새로운 안전장치가 이를 줄여주지만 완전히 없애지는 못해요.

AI 코칭에서 할루시네이션은 위험한가요?

성찰적인 주제일 때는 대체로 위험이 낮아요 — 감정에 이름 붙이기, 패턴 탐색, 대화 연습 같은 것들이요. 의료, 법률, 재무처럼 구체적인 정보가 필요한 주제에서는 위험이 높아져요 — 잘못된 답이 잘못된 행동으로 이어질 수 있으니까요. 확인하는 정도는 상황에 맞게 조절하세요. 동료에 대한 감정은 팩트체크할 필요가 없지만, 약물 상호작용에 대한 이야기라면 꼭 확인해야 해요.

AI가 만들어낸 정보인지 어떻게 구별하나요?

좁은 분야에서 확신에 찬 답변이 가장 의심해 봐야 할 신호예요 — 드문 질환, 지역별 규정, 특정 상담사 실명 같은 것들이요. 출처를 확인할 수 없는 인용, URL을 찾을 수 없는 "연구", 단서 조항 없는 의학 정보도 의심해야 해요. 문장이 깔끔하고 매끄러울수록 오히려 더 검증이 필요해요 — 유창함이 정확함을 뜻하지는 않으니까요.

AI가 하는 말, 팩트체크해야 할까요?

실생활에서 행동으로 옮길 내용이라면 — 네, 확인하세요. 검색 엔진으로 팩트체크하는 데 30초면 충분해요. 반면 자기 경험에 대한 성찰적 대화라면 덜 중요해요 — 그 대화에서는 본인이 기준점이니까요. 대략적인 구분은 이래요: 외부 사실(숫자, 인용, 규정)은 확인이 필요하고, 내면 탐색(지금 느끼는 것, 시도해 보고 싶은 것)은 그럴 필요 없어요.

AI 코치에 따라 정확도 차이가 있나요?

정확도는 기반 모델, 제품에 적용된 안전장치, 그리고 코치의 범위가 얼마나 좁게 설정되어 있는지에 따라 달라요. 잘 연구된 근거 기반 방법론(CBT, ACT, PDT)에 기반한 코치는 기반 자료 자체가 체계적이고 잘 정리되어 있어서 자유 형식 코치보다 벗어나는 경우가 적어요. Verke의 코치가 방법론별로 범위를 한정해둔 이유가 바로 이거예요.

Verke는 코칭을 제공하며, 치료나 의료 서비스가 아니에요. 효과는 개인마다 달라요. 위기 상황이라면 988 (미국), 116 123 (영국/EU, Samaritans), 또는 119에 전화하세요. 방문 findahelpline.com 에서 확인하세요.