Redazione di Verke

L'AI può allucinare consigli sbagliati? Sì — ecco come riconoscerli e gestirli

Redazione di Verke ·

L'AI può allucinare consigli sbagliati? Sì. I large language model ogni tanto inventano cose dal suono plausibile — uno studio che non esiste, una citazione sbagliata, un consiglio che non si applica alla tua situazione, un framework dal tono autorevole che è del tutto inventato. Nel coaching la posta in gioco è un po' più bassa che in ambito medico o legale, ma un consiglio sbagliato conta lo stesso. La versione onesta di questo articolo è che le protezioni riducono le allucinazioni ma non le eliminano, e la calibrazione dell'utente è parte di come uno strumento di coaching AI ben fatto resta utile.

L'articolo passa in rassegna dove si presentano le allucinazioni, come Verke è progettato per intercettare le categorie ad alto rischio e come calibrare la fiducia come utente — che è grosso modo "tratta i suggerimenti dell'AI come consigli da un amico intelligente che non sa tutto". La postura di Verke è preferire "non sono sicuro" a un "sicuro ma sbagliato", e tenere il coaching orientato all'esplorazione più che alla diagnosi. Niente di tutto questo rende impossibile l'allucinazione. Ma rende riconoscibili le modalità di errore e facili le mosse di recupero.

Cosa significa "allucinazione"

Come allucinano i language model

Un modello linguistico predice il testo successivo più probabile a partire dai pattern dei dati di addestramento. Nella maggior parte dei casi il testo successivo più probabile è anche il testo successivo corretto — è per questo che questi strumenti funzionano così bene. A volte, però, il testo più probabile è sbagliato. Il modello produce una risposta dal tono sicuro che non ha alcun fondamento. È la fluidità a confondere chi legge: la risposta sbagliata scorre con la stessa naturalezza di una giusta, perché il compito del modello è produrre testo fluido, non testo verificato.

Non è mentire — il modello non ha un'agenda, non ha un obiettivo, non sta cercando di ingannare. È il modello che non ha un componente "verità" separato che controlli l'output rispetto alla realtà prima di produrlo. Tecniche più recenti (retrieval, uso di strumenti, controlli di auto-coerenza, addestramento al rifiuto) riducono in modo significativo le allucinazioni, e il tasso continua a calare con ogni generazione di modelli. Non le eliminano, però. Trattare l'output dell'AI come "in larga parte giusto, ma da verificare nelle parti ad alto rischio" è la calibrazione giusta oggi e probabilmente per i prossimi anni.

Ti chiedi se fidarti dei consigli che ricevi?

Prova un esercizio CBT con Judith — 2 minuti, nessuna email richiesta.

Parla con Judith →

Dove si presentano le allucinazioni nel coaching

Citazioni inventate

La forma classica dell'allucinazione: "uno studio di Harvard del 2019 ha rilevato che…" seguito da un risultato dal tono sicuro che, quando vai a cercarlo, non esiste. L'articolo è inventato; gli autori sono inventati; la rivista magari è reale, ma il paper no. Il rimedio è verificare qualsiasi citazione che ti interessi su PubMed o Google Scholar prima di farci affidamento. Se è incluso un URL, cliccaci e controlla che l'abstract dica davvero ciò che è stato affermato — a volte l'URL è reale ma il riassunto allegato è sbagliato.

Consigli medici o legali specifici

Dosi, interazioni tra farmaci, normative giurisdizionali, procedure legali specifiche — tutto ciò in cui la risposta deve essere esattamente giusta o produce danni. Anche quando la risposta del modello è per caso corretta, è lo strumento sbagliato per queste domande, perché tu non hai modo di sapere se questa volta lo era. Verifica sempre con un professionista abilitato (medico, farmacista, avvocato, commercialista) prima di prendere qualsiasi decisione operativa in quegli ambiti. I coach di Verke sono progettati per rifiutare queste domande in modo netto invece di improvvisare — vedi la prossima sezione.

Risposte sicure su domini ristretti

Condizioni di nicchia con dati di addestramento scarsi, normative regionali di scarso interesse al di fuori del loro contesto, terapeuti specifici citati per nome, piccole comunità professionali. Il modello ha appena abbastanza pattern nei dati per produrre qualcosa di fluido, ma non abbastanza per sapere se è giusto. La combinazione di fluidità e ristrettezza è il segnale principale — quando l'argomento è oscuro ma la risposta è sicura, è lì che la calibrazione dovrebbe entrare in gioco.

Framework plausibili ma sbagliati

"Metodi in cinque passi" e "quattro pilastri di…" inventati che non esistono in letteratura. Il modello ha visto abbastanza struttura in stile manuale di self-help da produrne versioni dall'aspetto convincente, anche quando il framework specifico che descrive è inventato. Se un framework è importante per la decisione che stai prendendo, cerca l'autore o il nome del metodo per confermare che esista davvero, prima di trattarlo come prassi consolidata. I framework veri hanno pagine Wikipedia, libri e citazioni reali; quelli inventati no.

Cosa facciamo al riguardo

Cosa fa Verke al riguardo

Guardrail di dominio

I coach sono progettati per rifiutare le categorie ad alto rischio invece di improvvisare. Posologie mediche, interazioni tra farmaci, opinioni legali, affermazioni diagnostiche, qualunque cosa entri nel territorio dei professionisti abilitati — la risposta è reindirizzare, non tentare. "Sembra una domanda da fare a un farmacista" è una funzione, non un limite. Il prodotto preferisce non rispondere piuttosto che rispondere male.

Disciplina sulle citazioni

Quando un coach cita uno studio o un metodo, la citazione include un URL reale che l'utente può verificare (l'articolo StopOverthinking su questo sito cita A-Tjak et al. 2015 con un link a PubMed proprio per questo motivo — il lettore deve poter cliccare e controllare). Se il coach non riesce a citare qualcosa in modo verificabile, il framing diventa "ci sono evidenze che" oppure "è un pattern comune nel settore", non specifiche inventate. La soglia è "un lettore deve poter verificare in 30 secondi".

Default conservativi

Quando la conversazione lascia trasparire una certa gravità, la mossa di default è far emergere la cura clinica invece di improvvisare aiuto. I temi vicini alla crisi vengono indirizzati alle risorse di crisi. I temi vicini alla diagnosi vengono indirizzati a un clinico. Il prodotto è progettato per peccare per eccesso di prudenza — "per favore, porta questo a un essere umano" — quando la posta in gioco è alta, che è esattamente dove un'allucinazione, se passasse comunque, farebbe più danni.

Cosa puoi fare tu come utente

La calibrazione è un lavoro condiviso. Il prodotto fa la sua parte con guardrail e disciplina sulle citazioni; la parte dell'utente sono poche abitudini semplici che rendono molto meno gravi le allucinazioni quando capitano:

  • Tratta i suggerimenti dell'AI come i consigli di un amico intelligente che non sa tutto. Un buon punto di partenza, non l'ultima parola.
  • Verifica le citazioni prima di condividerle o di agire in base ad esse. PubMed e Google Scholar sono controlli da 30 secondi.
  • Chiedi "quanto sei sicuro di questo?" — i modelli a volte segnalano l'incertezza se sollecitati, e la risposta dice qualcosa.
  • Per qualunque cosa medica, legale o finanziaria — verifica con un professionista abilitato. In questi ambiti l'AI è lo strumento sbagliato da usare come fonte primaria.
  • Quando qualcosa non si adatta alla tua situazione, contraddicilo. La risposta si ricalibrerà su quello che hai aggiunto — un consiglio generico è spesso un segnale che il coach non ha ancora capito bene le specifiche.

Quando cercare ulteriore aiuto

Il self-help e il coaching AI possono fare molto, ma hanno dei limiti. Se stai attraversando una depressione grave che non si attenua, attacchi di panico che interrompono la vita quotidiana, pensieri di farti del male, l'elaborazione attiva di un trauma o una dipendenza da sostanze — sono segnali per rivolgerti a un professionista abilitato, non per insistere con uno strumento di coaching. Trovi opzioni a basso costo su opencounseling.com o linee di aiuto internazionali tramite findahelpline.com. Non c'è nessun premio per chi aspetta più del necessario.

Lavora con Judith

La calibrazione — "questo pensiero (o questo consiglio) è davvero accurato?" — è il cuore della CBT. L'approccio di Judith tratta le credenze come ipotesi da verificare, non come verità da prendere per oro colato, ed è esattamente la postura che ti permette di usare qualsiasi fonte (anche un coach AI) senza affidartici troppo. È brava anche nella versione meta: nota quando ti stai appoggiando troppo a una singola fonte — libro, podcast, amico, app — e ti riporta al tuo giudizio come filtro finale. Per saperne di più sul metodo, vedi Terapia Cognitivo-Comportamentale.

Prova un esercizio CBT con Judith — non serve creare un account

FAQ

Domande frequenti

Perché a volte l'AI inventa?

I large language model predicono testo probabile, non verità verificata. Riempiono i vuoti con qualcosa di plausibile quando non hanno informazioni solide — una risposta dal tono sicuro che non ha basi reali. Non è mentire (il modello non ha un'agenda); è il modello che non ha un componente "verità" separato con cui controllarsi. I guardrail più recenti riducono il fenomeno ma non lo eliminano.

Le allucinazioni sono pericolose nel coaching?

Posta in gioco di solito bassa quando il tema è riflessivo — dare un nome alle emozioni, esplorare pattern, provare conversazioni. Posta in gioco più alta quando il tema include dettagli medici, legali o finanziari, dove una risposta sbagliata diventa un'azione sbagliata. Tara lo sforzo di verifica sulla posta in gioco: una sensazione su un collega non ha bisogno di fact-checking; un'affermazione su un'interazione tra farmaci sì.

Come faccio a capire quando l'AI sta inventando?

Le risposte sicure su argomenti molto specifici sono il segnale più chiaro — patologie di nicchia, normative regionali, nomi precisi di terapeuti. Anche citazioni che non riesci a verificare, "studi" senza un URL rintracciabile e dettagli clinici privi di cautele alzano il livello di sospetto. Più il linguaggio è scorrevole e levigato, più merita una verifica: scioltezza non vuol dire accuratezza.

Devo verificare quello che mi dice l'AI?

Per qualsiasi cosa che intendi mettere in pratica nella vita reale — sì. Verificare un fatto richiede 30 secondi con un motore di ricerca. Per la conversazione riflessiva sulla tua esperienza conta meno, perché la fonte sei tu. La distinzione è grossomodo questa: le affermazioni esterne (numeri, citazioni, normative) vanno verificate; l'esplorazione interna (cosa stai sentendo, cosa vuoi provare) no.

Alcuni coach AI sono più accurati di altri?

L'accuratezza varia in base al modello sottostante, alle protezioni integrate dal prodotto e a quanto strettamente il coach è circoscritto. I coach ancorati a metodi evidence-based ben studiati (CBT, ACT, PDT) tendono a deviare meno dei coach generalisti, perché il materiale di partenza è strutturato e ben mappato. I coach di Verke sono circoscritti per metodo proprio per questa ragione.

Verke offre coaching, non terapia o assistenza medica. I risultati variano da persona a persona. Se sei in crisi, chiama 988 (US), 116 123 (UK/UE, Samaritans), o il tuo numero di emergenza locale. Visita findahelpline.com per risorse internazionali.