Strumenti di screening validati per la salute mentale — cosa misurano davvero HADS, PHQ-9 e GAD-7

Uno strumento di screening validato è un breve questionario con dietro uno studio pubblicato che mostra che, in media, può distinguere le persone con una data condizione da quelle senza, a un tasso di errore noto. È un'affermazione più ristretta di quanto faccia la maggior parte del marketing delle app, e molto più ristretta di quanto suggeriscano i titoli dei questionari. La «Generalized Anxiety Disorder 7-item scale» non diagnostica il disturbo d'ansia generalizzata. Ciascuno è uno strumento di screening con una sensibilità, una specificità e una popolazione di test pubblicate.

I tre strumenti di screening che compaiono più spesso nell'uso clinico, nella ricerca e nelle app sono HADS, PHQ-9 e GAD-7. Colors include lo HADS standard nella sezione Test, con gli stessi cut-off del lavoro originale del 1983.

Cos'è uno strumento di screening validato

Un questionario diventa «validato» quando i ricercatori lo testano rispetto a uno standard clinico di riferimento (di solito un colloquio diagnostico strutturato condotto da un clinico formato) e riportano quanto spesso i due concordano. Due numeri fanno gran parte del lavoro. La sensibilità è la proporzione di persone con la condizione che lo strumento segnala correttamente. La specificità è la proporzione di persone senza la condizione che esso lascia correttamente in pace. C'è sempre un compromesso tra le due, a qualunque dato cut-off.

Gli strumenti di screening qui presentati sono stati pubblicati su riviste cliniche mainstream: HADS su Acta Psychiatrica Scandinavica,¹ PHQ-9 sul Journal of General Internal Medicine,³ GAD-7 su Archives of Internal Medicine.⁴ I lavori di validazione sono pubblici, i cut-off sono documentati, ed esistono decenni di studi di follow-up. È questo che li separa dalla lunga coda di quiz non validati online.

HADS: come funziona e cosa misura

La Hospital Anxiety and Depression Scale fu progettata da Zigmond e Snaith nel 1983 per fare screening di ansia e depressione in pazienti ambulatoriali ospedalieri non psichiatrici.¹ Il problema clinico che stavano risolvendo: la malattia fisica e i suoi trattamenti producono sintomi somatici (cattivo sonno, scarsa energia, variazione di peso) che si sovrappongono pesantemente alla depressione nella maggior parte dei questionari sulla depressione dell'epoca. Un paziente medico generale poteva ottenere un punteggio alto a uno strumento per la depressione semplicemente perché stava fisicamente male.

HADS tralascia gli item somatici. Ha 14 domande (sette per l'ansia, sette per la depressione), ciascuna valutata da 0 a 3, per un intervallo di 0–21 per sottoscala. Il lavoro originale proponeva tre fasce per sottoscala: 0–7 normale, 8–10 borderline, 11 o più clinico. Quei cut-off sono ancora quelli in uso standard.

La rassegna del 2002 di Bjelland e colleghi sul Journal of Psychosomatic Research ha riunito 747 studi che avevano usato HADS nei due decenni precedenti.² In tutto quel corpo di lavoro, le sottoscale di ansia e depressione mostravano ciascuna una sensibilità e una specificità di circa 0,80 rispetto al colloquio clinico ai cut-off standard. Entrambe le sottoscale correlavano bene con altre misure di ansia e depressione, e la struttura a due fattori (ansia vs depressione) si replicava tra le popolazioni. È uno strumento utilizzabile: non perfetto, ma ben caratterizzato.

PHQ-9 e GAD-7

Il modulo per la depressione a 9 item del Patient Health Questionnaire è costruito direttamente sui criteri del DSM-IV per la depressione maggiore. Ciascuno dei nove item si mappa su uno dei nove criteri diagnostici, valutato da 0 (per niente) a 3 (quasi ogni giorno) nell'arco delle ultime due settimane. Punteggio totale 0–27. Lo studio di validazione del 2001 di Kroenke, Spitzer e Williams ha riportato fasce di gravità standard (0–4 minima, 5–9 lieve, 10–14 moderata, 15–19 moderatamente grave, 20–27 grave) e un cut-off raccomandato di 10 per ulteriori valutazioni.³

La meta-analisi del 2016 di Mitchell e colleghi ha aggregato 40 studi di cure primarie sul PHQ-9 rispetto al colloquio clinico.⁵ Al cut-off di 10, la sensibilità era intorno a 0,80 e la specificità intorno a 0,85: ampiamente simile a HADS, in una popolazione diversa, con un diverso set di domande. Il PHQ-9 include anche un item finale sui pensieri suicidari, che è una delle ragioni per cui i clinici spesso lo preferiscono a uno strumento di screening che non ce l'ha.

Il GAD-7 fu pubblicato da Spitzer, Kroenke, Williams e Löwe nel 2006 su Archives of Internal Medicine come strumento parallelo per l'ansia.⁴ Sette item, stessa scala 0–3, totale 0–21, con fasce di 0–4 minima, 5–9 lieve, 10–14 moderata, 15–21 grave. Lo studio di validazione originale ha riportato una sensibilità di 0,89 e una specificità di 0,82 a un cut-off di 10 rispetto a un colloquio strutturato per il disturbo d'ansia generalizzata, e il questionario si è anche comportato ragionevolmente bene come segnalatore per panico, ansia sociale e DPTS. In altre parole, coglie qualcosa di ansioso in modo più affidabile di quanto colga specificamente il GAD.

A cosa servono gli strumenti di screening, e a cosa no

Uno strumento di screening è utile come inizio di una conversazione. Un punteggio sopra il cut-off è un motivo strutturato per portare la questione a un medico di base o a un terapeuta, con un numero allegato, in una forma che quel clinico riconoscerà immediatamente. È utile anche come tracker: punteggi misurati alla stessa cadenza, nell'arco di settimane o mesi, mostrano se le cose stanno migliorando, peggiorando o restando ferme.

Uno strumento di screening non è utile come autodiagnosi. I nomi invitano a quella lettura errata; i lavori di validazione esplicitamente non la supportano. Una diagnosi richiede un clinico che raccolga un'anamnesi, escluda cause mediche e valuti lo schema nel tempo. La cifra di specificità di 0,80 lo implica già: all'incirca una persona su cinque senza la condizione otterrà comunque un punteggio sopra il cut-off, quindi uno screening positivo è un motivo per parlare con qualcuno, non un verdetto.

Uno strumento di screening non è nemmeno utile in crisi attiva. L'item 9 del PHQ-9 chiede dei pensieri di autolesionismo, ma un questionario non sostituisce un aiuto immediato. Se la risposta a quell'item è qualcosa di diverso da «per niente», il passo giusto successivo è parlare con una persona, non rifare il test.

Lo schema batte il singolo punteggio

Un singolo punteggio PHQ-9 preso in un pomeriggio storto è per lo più rumore. Le domande riguardano le ultime due settimane, ma l'atto di completare il questionario è plasmato dall'umore nel momento del completamento, dal bias di richiamo, da ciò che è appena successo quella mattina. L'andamento tra più somministrazioni porta molte più informazioni di qualunque singolo risultato.

La maggior parte dei terapeuti CBT che praticano cure basate sulla misurazione somministra PHQ-9 e GAD-7 ogni due-quattro settimane durante il trattamento attivo, e usa la traiettoria, non il punteggio assoluto, per decidere se il lavoro si sta muovendo. La stessa logica si applica al monitoraggio autosomministrato. Un punteggio nell'intervallo borderline stabile da sei mesi è un'informazione diversa da un punteggio nell'intervallo borderline che sale da sei settimane, e solo uno dei due è un allarme.

Come Colors usa HADS

Colors include il questionario HADS standard nella sezione Test, con fasce Normale / Borderline / Clinico corrispondenti ai cut-off originali di Zigmond e Snaith.¹ L'intento è lo stesso per cui il questionario è stato progettato: un modo strutturato per fare un controllo periodico, soprattutto quando qualcosa sembra fuori posto ma non è chiaro se sia situazionale o persistente.

Un singolo risultato HADS in Colors non è una diagnosi. È un'informazione che puoi portare a un medico di base o a un terapeuta se il punteggio è nell'intervallo borderline o clinico, oppure ripetere in due-quattro settimane se vuoi vedere se lo schema è stabile. Il caso più ampio dell'auto-osservazione come parte di un intervento strutturato, e dove le prove a suo favore effettivamente si collocano, è nella rassegna sulla ricerca sul monitoraggio dell'umore.

Domande frequenti

Cos'è uno strumento di screening validato per la salute mentale?

Uno strumento di screening validato è un breve questionario con uno studio pubblicato che mostra che individua una condizione in modo ragionevolmente buono in una popolazione definita. La Hospital Anxiety and Depression Scale (HADS) fu pubblicata da Zigmond e Snaith nel 1983; il PHQ-9 da Kroenke e colleghi nel 2001; il GAD-7 da Spitzer e colleghi nel 2006. Ciascuno è stato testato rispetto a uno standard clinico di riferimento, e ciascuno ha una sensibilità e una specificità note. Uno strumento di screening non è una diagnosi — è un modo strutturato per segnalare se qualcosa merita uno sguardo clinico più ravvicinato.

Cosa significa un punteggio HADS alto?

I cut-off originali del 1983 di Zigmond e Snaith dividono ciascuna sottoscala in 0–7 (normale), 8–10 (borderline) e 11+ (clinico). La rassegna del 2002 di Bjelland su 747 studi ha trovato sensibilità e specificità intorno a 0,80 per entrambe le sottoscale di ansia e depressione ai cut-off standard. Un punteggio nell'intervallo borderline o clinico significa che i sintomi meritano una conversazione clinica, non che una diagnosi sia confermata.

PHQ-9 e GAD-7 sono migliori di HADS?

Misurano cose che si sovrappongono ma leggermente diverse. HADS è stato progettato per pazienti ambulatoriali ospedalieri non psichiatrici e tralascia deliberatamente gli item somatici che si sovrappongono alla malattia fisica. Il PHQ-9 si mappa direttamente sui criteri DSM per la depressione. Il GAD-7 è stato progettato per l'ansia generalizzata nelle cure primarie. Nessuno è universalmente migliore — ciascuno ha la popolazione in cui è stato validato. La meta-analisi del 2016 di Mitchell su 40 studi di cure primarie ha trovato per il PHQ-9 una sensibilità intorno a 0,80 e una specificità intorno a 0,85 al cut-off standard di 10.

Uno strumento di screening può diagnosticarmi?

No. I nomi sono fuorvianti — il GAD-7 è la «Generalized Anxiety Disorder 7-item scale», che suona diagnostica, ma il lavoro originale di Spitzer 2006 è esplicito nel dire che è una misura di screening e di gravità, non un test diagnostico. Un punteggio alto significa considerare una valutazione clinica. Sono il colloquio con un clinico, l'anamnesi e l'esclusione di altre cause a produrre una diagnosi.

Ogni quanto dovrei ripetere uno strumento di screening?

La maggior parte della cura CBT basata sulla misurazione usa PHQ-9 e GAD-7 ogni 2–4 settimane durante il trattamento attivo per tracciare il cambiamento. Per l'auto-osservazione fuori dalla terapia, un intervallo simile è ragionevole. Ripetizioni quotidiane aggiungono rumore senza molto segnale, dato che le domande riguardano le ultime due settimane. Un singolo punteggio è raramente informativo da solo; lo è l'andamento tra più somministrazioni.

Questo non è un consiglio medico

Questo articolo è fornito solo a scopo informativo ed educativo. Non costituisce un consiglio medico e non sostituisce il consulto con un professionista della salute mentale abilitato. Se sei in crisi, contatta immediatamente i servizi di emergenza del tuo paese.

Linee di ascolto: Italia — Telefono Amico Italia 02 2327 2327 · Internazionale — Befrienders Worldwide

Ultima revisione: maggio 2026.

Riferimenti

Zigmond, A. S., & Snaith, R. P. (1983). The Hospital Anxiety and Depression Scale. Acta Psychiatrica Scandinavica, 67(6), 361–370. doi:10.1111/j.1600-0447.1983.tb09716.x
Bjelland, I., Dahl, A. A., Haug, T. T., & Neckelmann, D. (2002). The validity of the Hospital Anxiety and Depression Scale: An updated literature review. Journal of Psychosomatic Research, 52(2), 69–77. doi:10.1016/S0022-3999(01)00296-3
Kroenke, K., Spitzer, R. L., & Williams, J. B. (2001). The PHQ-9: Validity of a brief depression severity measure. Journal of General Internal Medicine, 16(9), 606–613. doi:10.1046/j.1525-1497.2001.016009606.x
Spitzer, R. L., Kroenke, K., Williams, J. B., & Löwe, B. (2006). A brief measure for assessing generalized anxiety disorder: the GAD-7. Archives of Internal Medicine, 166(10), 1092–1097. doi:10.1001/archinte.166.10.1092
Mitchell, A. J., Yadegarfar, M., Gill, J., & Stubbs, B. (2016). Case finding and screening clinical utility of the Patient Health Questionnaire (PHQ-9 and PHQ-2) for depression in primary care: a diagnostic meta-analysis of 40 studies. BJPsych Open, 2(2), 127–138. doi:10.1192/bjpo.bp.115.001685