Les questionnaires de dépistage validés en santé mentale — ce que mesurent vraiment HADS, PHQ-9 et GAD-7

Un questionnaire de dépistage validé est un court questionnaire derrière lequel se trouve une étude publiée montrant qu'en moyenne, il sait distinguer, à un taux d'erreur connu, les personnes atteintes d'un trouble donné de celles qui ne le sont pas. C'est une affirmation plus étroite que celle du marketing de la plupart des applications, et bien plus étroite que ne le suggèrent les titres des questionnaires. L'« échelle du trouble anxieux généralisé en 7 items » ne diagnostique pas le trouble anxieux généralisé. Chacun est un instrument de dépistage doté d'une sensibilité, d'une spécificité et d'une population de validation publiées.

Les trois questionnaires qui reviennent le plus souvent dans l'usage clinique, la recherche et les applications sont HADS, PHQ-9 et GAD-7. Colors inclut la HADS standard dans sa section Tests, avec les mêmes seuils que l'article original de 1983.

Ce qu'est un questionnaire validé

Un questionnaire devient « validé » quand des chercheurs le testent contre un étalon clinique de référence (généralement un entretien diagnostique structuré mené par un clinicien formé) et rapportent à quelle fréquence les deux concordent. Deux nombres font l'essentiel du travail. La sensibilité est la proportion de personnes atteintes du trouble que le questionnaire signale correctement. La spécificité est la proportion de personnes sans le trouble qu'il laisse correctement de côté. Il y a toujours un arbitrage entre les deux pour un seuil donné.

Les questionnaires présentés ici ont été publiés dans des revues cliniques de référence : HADS dans Acta Psychiatrica Scandinavica,¹ PHQ-9 dans le Journal of General Internal Medicine,³ GAD-7 dans Archives of Internal Medicine.⁴ Les articles de validation sont publics, les seuils sont documentés, et des décennies d'études de suivi existent. C'est ce qui les distingue de la longue traîne des quiz non validés en ligne.

HADS : comment elle fonctionne et ce qu'elle mesure

L'échelle hospitalière d'anxiété et de dépression a été conçue par Zigmond et Snaith en 1983 pour dépister l'anxiété et la dépression chez des patients hospitaliers non psychiatriques en ambulatoire.¹ Le problème clinique qu'ils cherchaient à résoudre : la maladie physique et ses traitements produisent des symptômes somatiques (mauvais sommeil, faible énergie, changement de poids) qui se confondent largement avec la dépression dans la plupart des questionnaires de dépression de l'époque. Un patient en médecine générale pouvait obtenir un score élevé à un questionnaire de dépression simplement parce qu'il était physiquement souffrant.

La HADS laisse de côté les items somatiques. Elle comporte 14 questions (sept pour l'anxiété, sept pour la dépression), chacune cotée de 0 à 3, ce qui donne une plage de 0 à 21 par sous-échelle. L'article original proposait trois bandes par sous-échelle : 0 à 7 normal, 8 à 10 limite, 11 ou plus clinique. Ces seuils restent ceux en usage standard.

La revue de Bjelland et ses collègues, parue en 2002 dans le Journal of Psychosomatic Research, a rassemblé 747 études ayant utilisé la HADS au cours des deux décennies précédentes.² À travers ce corpus, les sous-échelles d'anxiété et de dépression montraient chacune une sensibilité et une spécificité d'environ 0,80 face à un entretien clinique aux seuils standard. Les deux sous-échelles corrélaient bien avec d'autres mesures d'anxiété et de dépression, et la structure à deux facteurs (anxiété vs dépression) se reproduisait à travers les populations. C'est un instrument utilisable : pas parfait, mais bien caractérisé.

PHQ-9 et GAD-7

Le module de dépression du Patient Health Questionnaire, en 9 items, est construit directement à partir des critères du DSM-IV pour la dépression majeure. Chacun des neuf items correspond à l'un des neuf critères diagnostiques, coté de 0 (pas du tout) à 3 (presque tous les jours) sur les deux dernières semaines. Score total de 0 à 27. L'étude de validation de Kroenke, Spitzer et Williams en 2001 rapportait des bandes de sévérité standard (0 à 4 minimal, 5 à 9 léger, 10 à 14 modéré, 15 à 19 modérément sévère, 20 à 27 sévère) et un seuil recommandé de 10 pour une évaluation complémentaire.³

La méta-analyse de Mitchell et ses collègues en 2016 a regroupé 40 études du PHQ-9 en soins primaires face à un entretien clinique.⁵ Au seuil de 10, la sensibilité était d'environ 0,80 et la spécificité d'environ 0,85 : globalement comparable à la HADS, dans une population différente, avec un jeu de questions différent. Le PHQ-9 inclut aussi un dernier item sur les pensées suicidaires, ce qui est une raison pour laquelle les cliniciens le préfèrent souvent à un questionnaire qui n'en comporte pas.

Le GAD-7 a été publié par Spitzer, Kroenke, Williams et Löwe en 2006 dans Archives of Internal Medicine comme instrument parallèle pour l'anxiété.⁴ Sept items, la même échelle de 0 à 3, un total de 0 à 21, avec des bandes de 0 à 4 minimal, 5 à 9 léger, 10 à 14 modéré, 15 à 21 sévère. L'étude de validation d'origine rapportait une sensibilité de 0,89 et une spécificité de 0,82 à un seuil de 10 face à un entretien structuré pour le trouble anxieux généralisé, et le questionnaire se comportait aussi raisonnablement bien comme indicateur de trouble panique, d'anxiété sociale et de TSPT. Autrement dit, il repère quelque chose d'anxieux de façon plus fiable qu'il ne repère le TAG en particulier.

À quoi servent les questionnaires, et à quoi ils ne servent pas

Un questionnaire est utile comme amorce de conversation. Un score au-dessus du seuil est une raison structurée d'apporter la question à un médecin généraliste ou un thérapeute, avec un nombre attaché, sous une forme que le clinicien reconnaîtra immédiatement. Il est aussi utile comme outil de suivi : des scores mesurés au même rythme, sur des semaines ou des mois, montrent si les choses s'améliorent, se dégradent ou restent stables.

Un questionnaire n'est pas utile comme autodiagnostic. Les noms invitent à cette mauvaise lecture ; les articles de validation ne la soutiennent explicitement pas. Un diagnostic exige un clinicien qui prend des antécédents, exclut des causes médicales et évalue le schéma dans le temps. Le chiffre de spécificité de 0,80 l'implique déjà : environ une personne sur cinq sans le trouble obtiendra tout de même un score au-dessus du seuil, de sorte qu'un dépistage positif est une raison de parler à quelqu'un, pas un verdict.

Un questionnaire n'est pas non plus utile en pleine crise. L'item 9 du PHQ-9 interroge sur les pensées d'automutilation, mais un questionnaire ne remplace pas une aide immédiate. Si la réponse à cet item est autre que « pas du tout », le bon geste suivant est de parler à une personne, pas de refaire le test.

La tendance l'emporte sur le score isolé

Un score PHQ-9 isolé, pris un mauvais après-midi, n'est en grande partie que du bruit. Les questions portent sur les deux dernières semaines, mais l'acte de remplir le questionnaire est façonné par l'humeur du moment, par le biais de rappel, par ce qui vient de se passer le matin même. La tendance sur plusieurs passations porte bien plus d'information que n'importe quel résultat isolé.

La plupart des thérapeutes TCC pratiquant des soins fondés sur la mesure administrent le PHQ-9 et le GAD-7 toutes les deux à quatre semaines pendant le traitement actif, et se servent de la trajectoire, et non du score absolu, pour décider si le travail avance. La même logique s'applique au suivi auto-administré. Un score dans la zone limite stable depuis six mois est une information différente d'un score dans la zone limite qui grimpe depuis six semaines, et un seul des deux est une alarme.

Comment Colors utilise la HADS

Colors inclut le questionnaire HADS standard dans la section Tests, avec des bandes Normal / Limite / Clinique correspondant aux seuils d'origine de Zigmond et Snaith.¹ L'intention est la même que celle pour laquelle le questionnaire a été conçu : une façon structurée de faire le point périodiquement, surtout quand quelque chose semble aller de travers sans qu'il soit clair si c'est passager ou persistant.

Un résultat HADS isolé dans Colors n'est pas un diagnostic. C'est une information que vous pouvez apporter à un médecin généraliste ou un thérapeute si le score est dans la zone limite ou clinique, ou répéter dans deux à quatre semaines si vous voulez voir si le schéma est stable. L'argumentaire plus large en faveur de l'auto-observation dans le cadre d'une intervention structurée, et l'état réel des preuves, se trouvent dans la revue sur la recherche sur le suivi de l'humeur.

Questions fréquentes

Qu'est-ce qu'un questionnaire de dépistage validé en santé mentale ?

Un questionnaire validé est un court questionnaire accompagné d'une étude publiée montrant qu'il détecte raisonnablement bien un trouble dans une population définie. L'échelle hospitalière d'anxiété et de dépression (HADS) a été publiée par Zigmond et Snaith en 1983 ; le PHQ-9 par Kroenke et ses collègues en 2001 ; le GAD-7 par Spitzer et ses collègues en 2006. Chacun a été testé contre un étalon clinique de référence, et chacun a une sensibilité et une spécificité connues. Un questionnaire n'est pas un diagnostic — c'est une façon structurée de signaler si quelque chose mérite un examen clinique plus approfondi.

Que signifie un score HADS élevé ?

Les seuils d'origine de Zigmond et Snaith en 1983 divisent chaque sous-échelle en 0 à 7 (normal), 8 à 10 (limite) et 11 et plus (clinique). La revue de Bjelland en 2002, portant sur 747 études, a trouvé une sensibilité et une spécificité d'environ 0,80 pour les sous-échelles d'anxiété comme de dépression aux seuils standard. Un score dans la zone limite ou clinique signifie que les symptômes méritent une conversation clinique, pas qu'un diagnostic est confirmé.

PHQ-9 et GAD-7 valent-ils mieux que HADS ?

Ils mesurent des choses qui se recoupent mais diffèrent légèrement. La HADS a été conçue pour des patients hospitaliers non psychiatriques en ambulatoire et laisse délibérément de côté les items somatiques qui se confondent avec la maladie physique. Le PHQ-9 correspond directement aux critères de dépression du DSM. Le GAD-7 a été conçu pour l'anxiété généralisée en soins primaires. Aucun n'est universellement meilleur — chacun a la population dans laquelle il a été validé. La méta-analyse de Mitchell en 2016, portant sur 40 études en soins primaires, a trouvé une sensibilité du PHQ-9 d'environ 0,80 et une spécificité d'environ 0,85 au seuil standard de 10.

Un questionnaire peut-il me diagnostiquer ?

Non. Les noms induisent en erreur — le GAD-7 est l'« échelle du trouble anxieux généralisé en 7 items », ce qui sonne diagnostique, mais l'article original de Spitzer en 2006 précise explicitement qu'il s'agit d'une mesure de dépistage et de sévérité, pas d'un test diagnostique. Un score élevé signifie : envisager une évaluation clinique. C'est un entretien avec un clinicien, des antécédents et l'exclusion d'autres causes qui produisent un diagnostic.

À quelle fréquence faut-il refaire un questionnaire ?

La plupart des soins de TCC fondés sur la mesure utilisent le PHQ-9 et le GAD-7 toutes les 2 à 4 semaines pendant le traitement actif pour suivre le changement. Pour une auto-observation hors thérapie, un intervalle similaire est raisonnable. Refaire le test chaque jour ajoute du bruit sans grand signal, puisque les questions portent sur les deux dernières semaines. Un score isolé est rarement instructif en soi ; c'est la tendance sur plusieurs passations qui l'est.

Ceci n'est pas un avis médical

Cet article est fourni à titre informatif et éducatif uniquement. Il ne constitue pas un avis médical et ne remplace pas la consultation d'un professionnel de santé mentale agréé. En cas de crise, contactez immédiatement les services d'urgence de votre pays.

Lignes d'écoute de crise : France — 3114, prévention du suicide · International — Befrienders Worldwide

Dernière révision : mai 2026.

Références

Zigmond, A. S., & Snaith, R. P. (1983). The Hospital Anxiety and Depression Scale. Acta Psychiatrica Scandinavica, 67(6), 361–370. doi:10.1111/j.1600-0447.1983.tb09716.x
Bjelland, I., Dahl, A. A., Haug, T. T., & Neckelmann, D. (2002). The validity of the Hospital Anxiety and Depression Scale: An updated literature review. Journal of Psychosomatic Research, 52(2), 69–77. doi:10.1016/S0022-3999(01)00296-3
Kroenke, K., Spitzer, R. L., & Williams, J. B. (2001). The PHQ-9: Validity of a brief depression severity measure. Journal of General Internal Medicine, 16(9), 606–613. doi:10.1046/j.1525-1497.2001.016009606.x
Spitzer, R. L., Kroenke, K., Williams, J. B., & Löwe, B. (2006). A brief measure for assessing generalized anxiety disorder: the GAD-7. Archives of Internal Medicine, 166(10), 1092–1097. doi:10.1001/archinte.166.10.1092
Mitchell, A. J., Yadegarfar, M., Gill, J., & Stubbs, B. (2016). Case finding and screening clinical utility of the Patient Health Questionnaire (PHQ-9 and PHQ-2) for depression in primary care: a diagnostic meta-analysis of 40 studies. BJPsych Open, 2(2), 127–138. doi:10.1192/bjpo.bp.115.001685