療法

妥当性が検証されたメンタルヘルススクリーナー — HADS、PHQ-9、GAD-7が実際に測るもの

妥当性が検証されたメンタルヘルススクリーナー — HADS、PHQ-9、GAD-7 — について、何を測り、スコアが何を意味し、どう誠実に使うかを平易な言葉で解説します。

妥当性が検証されたスクリーナーとは、平均として、ある状態を持つ人と持たない人を既知の誤差率で見分けられることを示す、発表済みの研究を背後に持つ短い質問票です。これは、ほとんどのアプリの宣伝が行うよりも狭い主張であり、質問票の題名が示唆するよりもはるかに狭い主張です。「全般性不安障害7項目尺度」は、全般性不安障害を診断しません。それぞれは、発表された感度、特異度、そして検証された集団を持つスクリーニング道具です。

臨床利用、研究、アプリで最もよく登場する3つのスクリーナーは、HADS、PHQ-9、GAD-7です。Colorsは、標準のHADSをTestsセクションに、1983年の元の論文と同じカットオフで収録しています。

妥当性が検証されたスクリーナーとは何か

研究者が質問票を臨床的な基準(通常は訓練を受けた臨床家による構造化された診断面接)と照らし合わせて検証し、両者がどのくらいの頻度で一致するかを報告したとき、その質問票は「妥当性が検証された」ものになります。二つの数字がその大半を担います。感度は、その状態を持つ人のうちスクリーナーが正しく拾い上げる割合です。特異度は、その状態を持たない人のうち正しく見逃さない割合です。どのカットオフにおいても、両者のあいだには常にトレードオフがあります。

ここで扱うスクリーナーは、主要な臨床雑誌に発表されました。HADSは Acta Psychiatrica Scandinavica に、1 PHQ-9は Journal of General Internal Medicine に、3 GAD-7は Archives of Internal Medicine にです。4 検証論文は公開され、カットオフは文書化され、何十年もの追跡研究が存在します。これこそが、オンラインの妥当性が検証されていないクイズの長い裾野と一線を画す点です。

HADS — その仕組みと測るもの

病院不安抑うつ尺度は、精神科以外の病院外来患者における不安と抑うつをスクリーニングするために、1983年にZigmondとSnaithが設計しました。1 彼らが解こうとしていた臨床的な問題はこうです。身体疾患とその治療は身体症状(睡眠の悪化、低い活力、体重の変化)を生み、それが当時のほとんどのうつ病質問票で抑うつと大きく重なってしまうのです。一般内科の患者は、単に身体的に具合が悪いだけで、うつ病スクリーナーで高得点を取り得たのです。

HADSは身体症状の項目を省いています。14の質問(不安に7つ、抑うつに7つ)があり、それぞれ0から3で評価され、下位尺度ごとに0〜21の範囲を与えます。元の論文は、下位尺度ごとに3つの帯を提案しました。0〜7が正常、8〜10が境界域、11以上が臨床域です。これらのカットオフは、今も標準的に使われているものです。

Bjellandらの2002年の Journal of Psychosomatic Research のレビューは、それ以前の20年間にHADSを用いた747件の研究をまとめました。2 その研究群を通じて、不安と抑うつの下位尺度はそれぞれ、標準カットオフにおいて臨床面接に対しておよそ0.80の感度と特異度を示しました。両下位尺度は他の不安・抑うつ測定とよく相関し、2因子構造(不安と抑うつ)は集団をまたいで再現されました。これは使える道具です。完璧ではありませんが、特性がよく把握されています。

PHQ-9とGAD-7

患者健康質問票9項目うつモジュールは、大うつ病に対するDSM-IVの基準から直接組み立てられています。9項目のそれぞれが9つの診断基準の一つに対応し、過去2週間について0(まったくない)から3(ほぼ毎日)で評価されます。合計スコアは0〜27です。Kroenke、Spitzer、Williamsの2001年の検証研究は、標準的な重症度の帯(0〜4が最小、5〜9が軽度、10〜14が中等度、15〜19が中等度から重度、20〜27が重度)と、さらなるアセスメントのための推奨カットオフ10を報告しました。3

Mitchellらの2016年のメタ分析は、PHQ-9を臨床面接と照らし合わせた40件のプライマリケア研究をプールしました。5 カットオフ10において、感度は約0.80、特異度は約0.85でした。これは、異なる集団で、異なる質問群を用いながら、HADSとおおむね同様です。PHQ-9にはまた、自殺念慮についての最後の項目が含まれており、これは臨床家がそれを含まないスクリーナーよりもPHQ-9を好むことが多い理由の一つです。

GAD-7は、並行する不安道具として、Spitzer、Kroenke、Williams、Löweが2006年に Archives of Internal Medicine に発表しました。4 7項目、同じ0〜3の尺度、合計0〜21で、0〜4が最小、5〜9が軽度、10〜14が中等度、15〜21が重度の帯を持ちます。元の検証研究は、全般性不安障害の構造化面接に対して、カットオフ10で感度0.89、特異度0.82を報告し、この質問票はパニック、社交不安、PTSDの目印としてもそれなりによく機能しました。言い換えれば、GADそのものよりも 何か不安なもの を、より確実に拾い上げます。

スクリーナーが役立つこと、役立たないこと

スクリーナーは、対話の出発点として有用です。カットオフを上回るスコアは、その問いを総合診療医やセラピストに持ち込む、数字の付いた構造化された理由であり、臨床家が即座に認識できる形をとっています。トラッカーとしても有用です。同じ周期で、数週間または数か月にわたって測定されたスコアは、事態が良くなっているか、悪くなっているか、横ばいかを示します。

スクリーナーは、自己診断としては役立ちません。名称はその誤読を誘いますが、検証論文は明示的にそれを支持しません。診断には、臨床家が病歴を取り、医学的原因を除外し、時間をかけてパターンをアセスメントすることが必要です。0.80という特異度の数字がすでにそれを示唆しています。その状態を 持たない 人のおよそ5人に1人は、それでもカットオフを上回るスコアを取るので、陽性のスクリーニングは誰かに話す理由であって、判決ではありません。

スクリーナーは、活動的な危機のさなかでも役立ちません。PHQ-9の項目9は自傷の念慮について尋ねますが、質問票は即時の助けの代わりにはなりません。その項目への答えが「まったくない」以外の何かであれば、正しい次の一歩は、テストを受け直すことではなく、人に話すことです。

パターンは単一のスコアに勝る

悪い午後に取られた単一のPHQ-9のスコアは、ほとんどがノイズです。質問は過去2週間について尋ねますが、質問票に記入するという行為は、記入の瞬間の気分、想起バイアス、その朝に起こったばかりのことによって形作られます。複数回の実施にわたる傾向は、いかなる単一の結果よりもはるかに多くの情報を運びます。

測定に基づくケアを実践するほとんどのCBTセラピストは、積極的な治療期間中にPHQ-9とGAD-7を2〜4週間ごとに実施し、絶対的なスコアではなく軌跡を用いて、作業が進んでいるかどうかを判断します。同じ論理が、自己実施の記録にも当てはまります。6か月間安定している境界域のスコアは、6週間上昇し続けている境界域のスコアとは異なる情報であり、警報なのはそのうちの一方だけです。

ColorsはHADSをどう使うか

Colorsは、標準のHADS質問票をTestsセクションに収録しており、正常/境界域/臨床域の帯はZigmondとSnaithの元のカットオフに一致しています。1 意図は、この質問票が設計された目的と同じです。何かがおかしく感じられるが、それが状況によるものか持続するものかが定かでないときに特に、定期的に自分の状態を確認する構造化された方法を提供することです。

Colorsにおける単一のHADSの結果は、診断ではありません。それは、スコアが境界域または臨床域にあれば総合診療医やセラピストに持って行ける情報であり、パターンが安定しているかを見たければ2〜4週間後に繰り返せる情報です。構造化された介入の一部としてのセルフモニタリングのより広い根拠と、そのエビデンスが実際にどこに位置するかは、気分記録の研究のレビューにあります。

よくある質問

妥当性が検証されたメンタルヘルススクリーナーとは何ですか?

妥当性が検証されたスクリーナーとは、定められた集団においてある状態をそれなりにうまく検出することを示す発表済みの研究を伴う、短い質問票のことです。病院不安抑うつ尺度(HADS)は1983年にZigmondとSnaithが発表し、PHQ-9は2001年にKroenkeらが、GAD-7は2006年にSpitzerらが発表しました。それぞれ臨床的な基準と照らし合わせて検証され、それぞれ既知の感度と特異度を持っています。スクリーナーは診断ではありません — 何かがより詳しい臨床的検討に値するかどうかを示す、構造化された方法です。

HADSのスコアが高いことは何を意味しますか?

ZigmondとSnaithの1983年の元のカットオフは、各下位尺度を0〜7(正常)、8〜10(境界域)、11以上(臨床域)に分けます。Bjellandの2002年の747件の研究のレビューは、標準カットオフにおいて、不安と抑うつのどちらの下位尺度でも感度・特異度が約0.80であることを見出しました。境界域または臨床域のスコアは、症状が臨床的な対話に値することを意味するのであって、診断が確定したことを意味するわけではありません。

PHQ-9とGAD-7はHADSより優れていますか?

それらは重なり合いつつも少し異なるものを測ります。HADSは精神科以外の病院外来患者向けに設計され、身体疾患と重なる身体症状の項目を意図的に省いています。PHQ-9はDSMのうつ病の基準に直接対応します。GAD-7はプライマリケアにおける全般性不安のために設計されました。どれも普遍的に優れてはいません — それぞれ妥当性が検証された集団を持っています。Mitchellの2016年の40件のプライマリケア研究のメタ分析は、標準カットオフ10において、PHQ-9の感度が約0.80、特異度が約0.85であることを見出しました。

スクリーナーは私を診断できますか?

できません。名称は誤解を招きます — GAD-7は「全般性不安障害7項目尺度」であり、診断的に聞こえますが、Spitzerの2006年の元の論文は、それが診断検査ではなくスクリーニングと重症度の測定であることを明示しています。スコアが高いことは、臨床的なアセスメントを検討すべきという意味です。診断を生むのは、臨床家による面接、病歴、そして他の原因の除外です。

スクリーナーはどのくらいの頻度で受け直すべきですか?

ほとんどの測定に基づくCBTのケアでは、変化を追跡するために、積極的な治療期間中はPHQ-9とGAD-7を2〜4週間ごとに用います。療法の外でのセルフモニタリングについても、同様の間隔が妥当です。質問は過去2週間について尋ねるため、毎日受け直しても、シグナルはあまり増えずノイズが増えます。単一のスコアはそれ自体ではめったに有益ではありません。有益なのは、複数回の実施にわたる傾向です。

これは医療アドバイスではありません

この記事は情報提供および教育のみを目的としています。医療アドバイスではなく、資格を持つ メンタルヘルスの専門家への相談に代わるものではありません。危機的な状況にある場合は、 直ちにお住まいの国の救急サービスに連絡してください。

危機相談窓口: 日本 — よりそいホットライン 0120-279-338 · 国際 — Befrienders Worldwide

最終確認: 2026年5月。

参考文献

  1. Zigmond, A. S., & Snaith, R. P. (1983). The Hospital Anxiety and Depression Scale. Acta Psychiatrica Scandinavica, 67(6), 361–370. doi:10.1111/j.1600-0447.1983.tb09716.x
  2. Bjelland, I., Dahl, A. A., Haug, T. T., & Neckelmann, D. (2002). The validity of the Hospital Anxiety and Depression Scale: An updated literature review. Journal of Psychosomatic Research, 52(2), 69–77. doi:10.1016/S0022-3999(01)00296-3
  3. Kroenke, K., Spitzer, R. L., & Williams, J. B. (2001). The PHQ-9: Validity of a brief depression severity measure. Journal of General Internal Medicine, 16(9), 606–613. doi:10.1046/j.1525-1497.2001.016009606.x
  4. Spitzer, R. L., Kroenke, K., Williams, J. B., & Löwe, B. (2006). A brief measure for assessing generalized anxiety disorder: the GAD-7. Archives of Internal Medicine, 166(10), 1092–1097. doi:10.1001/archinte.166.10.1092
  5. Mitchell, A. J., Yadegarfar, M., Gill, J., & Stubbs, B. (2016). Case finding and screening clinical utility of the Patient Health Questionnaire (PHQ-9 and PHQ-2) for depression in primary care: a diagnostic meta-analysis of 40 studies. BJPsych Open, 2(2), 127–138. doi:10.1192/bjpo.bp.115.001685