Verke Editorial

Kan AI hallucinere dårlige råd? Ja — sådan spotter og håndterer du det

Verke Editorial ·

Kan AI hallucinere dårlige råd? Ja. Store sprogmodeller finder lejlighedsvist på ting, der lyder plausible — et studie der ikke findes, en kildehenvisning der er forkert, et råd der ikke passer på din situation, en selvsikker ramme der er fri fantasi. Coaching-sammenhænge har lidt lavere indsats end medicinske eller juridiske sammenhænge, men dårlige råd betyder stadig noget. Den ærlige version af denne artikel er, at sikkerhedsforanstaltninger reducerer hallucination, men ikke fjerner den, og at brugerens egen kalibrering er en del af, hvordan et velfungerende AI-coachingværktøj forbliver brugbart.

Artiklen går igennem, hvor hallucination dukker op, hvordan Verke er designet til at fange højrisiko-kategorierne, og hvordan du som bruger kalibrerer din tillid — hvilket groft sagt er "behandl AI-forslag som råd fra en klog ven, der ikke ved alt." Verkes holdning er at foretrække "det er jeg ikke sikker på" frem for selvsikkert-men-forkert og at holde coachingen rettet mod udforskning frem for diagnose. Intet af det gør hallucination umuligt. Det gør fejlmønstrene genkendelige og genoprettelsen nem.

Hvad "hallucination" betyder

Hvordan sprogmodeller finder på

En sprogmodel forudsiger sandsynlig næste tekst ud fra mønstre i sine træningsdata. Det meste af tiden er den mest sandsynlige næste tekst også den korrekte næste tekst — det er derfor, disse værktøjer fungerer, så godt som de gør. Nogle gange er den mest sandsynlige næste tekst dog forkert. Modellen producerer et selvsikkert svar, der ikke har hold i virkeligheden. Flydende sprog er det punkt, der forvirrer folk: det forkerte svar læses lige så glat som et rigtigt, fordi modellens opgave er flydende tekst, ikke verificeret tekst.

Det er ikke løgn — modellen har ingen dagsorden, intet mål, intet forsøg på at bedrage. Det er at modellen ikke har en separat "sandhedskomponent", der tjekker outputtet mod virkeligheden, før den producerer det. Nyere teknikker (retrieval, værktøjsbrug, selvkonsistenstjek, refusal-træning) reducerer hallucination meningsfuldt, og raten bliver ved med at falde med hver modelgeneration. De fjerner det dog ikke. At behandle AI-output som "for det meste rigtigt, men verificér de dele med høj indsats" er den rette kalibrering i dag og sandsynligvis de næste mange år.

I tvivl om, hvorvidt du kan stole på de råd, du får?

Prøv en KBT-øvelse med Judith — 2 minutter, ingen mail nødvendig.

Chat med Judith →

Hvor hallucination dukker op i coaching

Opfundne kildehenvisninger

Den klassiske hallucinationsform: "et Harvard-studie fra 2019 fandt, at…" efterfulgt af et selvsikkert resultat, der, når du går for at slå det op, ikke findes. Artiklen er opfundet; forfatterne er opfundne; tidsskriftets navn er måske rigtigt, men artiklen er ikke. Løsningen er at verificere enhver kildehenvisning, der har betydning for dig, via PubMed eller Google Scholar, før du læner dig op ad den. Hvis der er en URL, så klik dig igennem og tjek, at abstractet faktisk siger det, der blev påstået — nogle gange er URL'en rigtig, men resuméet, der er knyttet til den, er forkert.

Specifikke medicinske eller juridiske råd

Doser, lægemiddelinteraktioner, jurisdiktionsspecifikke regler, konkrete juridiske procedurer — alt hvor svaret skal være præcist rigtigt, ellers gør det skade. Selv når modellens svar tilfældigvis er korrekt, er det det forkerte værktøj til de spørgsmål, fordi der ikke er nogen måde, du kan vide, om det var rigtigt denne gang. Verificér altid med en autoriseret fagperson (læge, farmaceut, advokat, revisor) for noget, der skal handles på i de domæner. Verkes coaches er designet til direkte at afvise de spørgsmål frem for at improvisere — se næste afsnit.

Selvsikre svar i smalle domæner

Nichetilstande med sparsomme træningsdata, regionale regler som det meste af verden er ligeglad med, navngivne terapeuter, små faglige miljøer. Modellen har lige nok mønster i træningsdataene til at producere noget flydende, men ikke nok til at vide, om det er rigtigt. Kombinationen af flydende sprog og smalt felt er hovedsignalet — når emnet er obskurt, men svaret er selvsikkert, er det der, kalibreringen skal sætte ind.

Plausible men forkerte rammer

Opfundne "fem-trins-metoder" og "fire søjler i…", som ikke findes i litteraturen. Modellen har set nok selvhjælps-agtig struktur til at producere overbevisende udseende versioner af det, selv når den specifikke ramme, den beskriver, er opfundet. Hvis en ramme har betydning for den beslutning, du træffer, så slå forfatteren eller metodens navn op for at bekræfte, at den findes, før du behandler den som standardpraksis. Rigtige rammer har rigtige Wikipedia-sider, bøger og kildehenvisninger; opfundne har ikke.

Hvad vi gør ved det

Hvad Verke gør ved det

Domænesikring

Coachene er designet til at afvise højrisiko-kategorierne frem for at improvisere. Medicinsk dosering, lægemiddelinteraktioner, juridiske vurderinger, diagnostiske påstande, alt der krydser ind på autoriseret-fagligt territorium — svaret er at viderehenvise frem for at forsøge. "Det lyder som et spørgsmål til en farmaceut" er en feature, ikke en begrænsning. Produktet vil hellere undlade at svare end svare forkert.

Kildedisciplin

Når en coach henviser til et studie eller en metode, indeholder kildehenvisningen en rigtig URL, brugeren kan verificere (StopOverthinking-artiklen på dette site citerer A-Tjak et al. 2015 med et PubMed-link netop af den grund — læsere skal kunne klikke sig igennem og tjekke). Hvis coachen ikke kan citere noget verificerbart, skifter formuleringen til "der er evidens for, at" eller "det er et almindeligt mønster i feltet", ikke opfundne detaljer. Tærsklen er "en læser kan verificere det her på 30 sekunder."

Konservative standarder

Når samtalen antyder alvorlighed, er standardtrækket at henvise til klinisk hjælp frem for at improvisere. Krise-relaterede emner ledes til kriseressourcer. Diagnose-relaterede emner ledes til en behandler. Produktet er designet til at fejle på siden af "tag det her med til et menneske", når indsatsen er høj — hvilket er der, hvor hallucination ville gøre mest skade, hvis den alligevel slap igennem.

Hvad du som bruger kan gøre

Kalibrering er fælles arbejde. Produktet holder sin del med sikkerhedsforanstaltninger og kildedisciplin; din del er nogle få simple vaner, der gør hallucination meget mindre dyr, når den sker:

  • Behandl AI-forslag som råd fra en klog ven, der ikke ved alt. Et brugbart udgangspunkt, ikke det sidste ord.
  • Verificér kildehenvisninger, før du deler dem eller handler på dem. PubMed og Google Scholar er 30-sekunders-tjek.
  • Spørg "hvor sikker er du på det her?" — modeller kan nogle gange flagge usikkerhed, når de bliver spurgt, og svaret er informativt.
  • For noget medicinsk, juridisk eller økonomisk — verificér med et autoriseret menneske. AI er det forkerte værktøj som primær kilde i de domæner.
  • Når noget ikke passer på din situation, så sig fra. Svaret kalibrerer sig efter det, du har tilføjet — generiske råd er ofte et tegn på, at coachen endnu ikke har fanget detaljerne fuldt ud.

Hvornår skal du søge mere hjælp?

Selvhjælp og AI-coaching kan en hel del, men der er grænser. Hvis du oplever svær depression, der ikke har lettet, panikanfald, der forstyrrer hverdagen, tanker om selvskade, aktiv traumebearbejdning eller misbrugsproblemer — så er det signaler om at arbejde sammen med en autoriseret behandler, ikke signaler om at presse hårdere på et coachingværktøj. Du kan finde billige muligheder hos opencounseling.com eller internationale hjælpelinjer via findahelpline.com. Der er ingen præmie for at vente længere end nødvendigt.

Arbejd med Judith

Kalibrering — "er denne tanke (eller dette råd) faktisk præcist?" — er kerne-KBT. Judiths tilgang behandler overbevisninger som hypoteser, der skal testes, frem for fakta, der skal sluges, hvilket er præcis den holdning, der lader dig bruge enhver kilde til input (også en AI-coach) uden at tro for meget på den. Hun er også god til metaversionen: at lægge mærke til, når du læner dig for tungt op ad én enkelt kilde — bog, podcast, ven, app — og trække dig tilbage mod din egen dømmekraft som det sidste filter. For mere om metoden, se Kognitiv adfærdsterapi.

Prøv en KBT-øvelse med Judith — ingen konto påkrævet

FAQ

Hyppige spørgsmål

Hvorfor finder AI'en nogle gange på?

Store sprogmodeller forudsiger sandsynlig tekst, ikke verificeret sandhed. De udfylder plausibelt lydende huller, når de ikke har funderet information — et selvsikkert svar uden reelt grundlag. Det er ikke løgn (modellen har ingen dagsorden); det er at modellen ikke har en separat "sandhedskomponent", den kan tjekke sig selv mod. Nyere sikkerhedsforanstaltninger reducerer det, men fjerner det ikke.

Er hallucination farligt i coaching?

Som regel lav indsats, når emnet er reflekterende — at sætte ord på følelser, udforske mønstre, øve samtaler. Højere indsats når emnet involverer medicinske, juridiske eller økonomiske detaljer, hvor et forkert svar oversættes til en forkert handling. Tilpas dit verifikationsarbejde til indsatsen: en følelse om en kollega behøver ikke faktatjek; en påstand om en lægemiddelinteraktion gør.

Hvordan kan jeg se, hvornår AI'en finder på?

Selvsikre svar i smalle domæner er det største tegn — nichetilstande, regionale regler, navngivne terapeuter. Kildehenvisninger du ikke kan verificere, "studier" uden URL'er der kan findes, og medicinske detaljer uden forbehold fortjener også højere mistanke. Jo renere og mere poleret sproget er, jo mere verifikation fortjener det; flydende sprog er ikke det samme som nøjagtighed.

Skal jeg faktatjekke det, AI'en fortæller mig?

For alt, der skal handles på i virkeligheden — ja. Faktatjek tager 30 sekunder med en søgemaskine. For reflekterende samtale om din egen oplevelse betyder det mindre, fordi du er sandhedskilden. Opdelingen er groft sagt: eksterne påstande (tal, kildehenvisninger, regler) skal verificeres; intern udforskning (hvad du føler, hvad du vil prøve) skal ikke.

Er nogle AI-coaches mere præcise end andre?

Nøjagtigheden varierer afhængigt af den underliggende model, de sikkerhedsforanstaltninger produktet lægger omkring den, og hvor snævert coachen er afgrænset. Coaches, der bygger på veldokumenterede evidensbaserede metoder (CBT, ACT, PDT), kommer typisk sjældnere på afveje end fritformede coaches, fordi grundmaterialet er struktureret og godt kortlagt. Verkes coaches er afgrænset efter metode netop af den grund.

Verke leverer coaching, ikke terapi eller medicinsk behandling. Resultater varierer fra person til person. Hvis du er i krise, så ring 988 (USA), 116 123 (UK/EU, Samaritans), eller dit lokale alarmnummer. Besøg findahelpline.com for internationale ressourcer.