검증된 정신 건강 선별 도구 — HADS, PHQ-9, GAD-7이 실제로 측정하는 것

검증된 선별 도구란, 평균적으로 특정 상태를 가진 사람과 가지지 않은 사람을 알려진 오류율로 구별할 수 있음을 보여주는 출판된 연구를 뒤에 둔 짧은 설문지입니다. 이는 대부분의 앱 마케팅이 내세우는 것보다 좁은 주장이고, 설문지의 제목이 시사하는 것보다 훨씬 좁은 주장입니다. "범불안장애 7문항 척도"는 범불안장애를 진단하지 않습니다. 각각은 출판된 민감도, 특이도, 그리고 검증된 인구 집단을 가진 선별 도구입니다.

임상 진료, 연구, 앱에서 가장 자주 등장하는 세 선별 도구는 HADS, PHQ-9, GAD-7입니다. Colors는 표준 HADS를 검사(Tests) 섹션 아래에, 원래 1983년 논문과 동일한 절단점으로 포함합니다.

검증된 선별 도구란 무엇인가

연구자들이 설문지를 임상 기준 표준(보통 훈련된 임상의의 구조화된 진단 면담)에 대조해 검증하고 둘이 얼마나 자주 일치하는지 보고할 때 그 설문지는 "검증된" 것이 됩니다. 두 수치가 작업의 대부분을 합니다. 민감도는 상태를 가진 사람 중 선별 도구가 올바르게 표시하는 비율입니다. 특이도는 상태를 가지지 않은 사람 중 선별 도구가 올바르게 내버려 두는 비율입니다. 어떤 주어진 절단점에서든 둘 사이에는 항상 절충이 있습니다.

여기 나온 선별 도구들은 주류 임상 학술지에 발표되었습니다. HADS는 Acta Psychiatrica Scandinavica 에,¹ PHQ-9는 Journal of General Internal Medicine 에,³ GAD-7은 Archives of Internal Medicine 에 실렸습니다.⁴ 검증 논문은 공개되어 있고, 절단점은 문서화되어 있으며, 수십 년의 후속 연구가 존재합니다. 이것이 온라인의 검증되지 않은 수많은 퀴즈들과 그것들을 가르는 차이입니다.

HADS: 작동 방식과 측정 대상

병원 불안 우울 척도는 비정신과 병원 외래 환자에서 불안과 우울을 선별하기 위해 Zigmond와 Snaith가 1983년에 설계했습니다.¹ 그들이 풀고자 한 임상적 문제는 이것이었습니다. 신체 질환과 그 치료는 당시 대부분의 우울 설문지에서 우울과 크게 겹치는 신체 증상(나쁜 수면, 낮은 에너지, 체중 변화)을 만들어냅니다. 일반 내과 환자가 단지 몸이 아프다는 이유만으로 우울 선별 도구에서 높은 점수를 받을 수 있었던 것이죠.

HADS는 신체 증상 항목을 뺍니다. 14개 질문(불안 7개, 우울 7개)으로 이루어지고 각각 0에서 3으로 평가되어 하위 척도당 0~21 범위를 줍니다. 원래 논문은 하위 척도당 세 구간을 제안했습니다. 0~7 정상, 8~10 경계, 11 이상 임상. 이 절단점들은 여전히 표준으로 사용됩니다.

Journal of Psychosomatic Research 에 실린 Bjelland 등의 2002년 리뷰는 직전 20년간 HADS를 사용한 747개 연구를 모았습니다.² 그 연구 전반에서 불안 및 우울 하위 척도는 각각 표준 절단점에서 임상 면담 대비 대략 0.80의 민감도와 특이도를 보였습니다. 두 하위 척도 모두 다른 불안 및 우울 측정 도구와 잘 상관되었고, 두 요인 구조(불안 대 우울)는 인구 집단 전반에서 재현되었습니다. 이것은 쓸 만한 도구입니다. 완벽하지는 않지만 잘 규명되어 있습니다.

PHQ-9와 GAD-7

환자 건강 설문지 9문항 우울 모듈은 주요우울증에 대한 DSM-IV 기준으로부터 직접 만들어졌습니다. 아홉 항목 각각이 아홉 진단 기준 중 하나에 대응되며, 지난 2주에 걸쳐 0(전혀 아님)에서 3(거의 매일)으로 채점됩니다. 총점 0~27. Kroenke, Spitzer, Williams의 2001년 검증 연구는 표준 중증도 구간(0~4 최소, 5~9 경도, 10~14 중등도, 15~19 중등도-중증, 20~27 중증)과 추가 평가를 위한 권장 절단점 10을 보고했습니다.³

Mitchell 등의 2016년 메타분석은 PHQ-9를 임상 면담에 대조한 1차 진료 연구 40건을 통합했습니다.⁵ 절단점 10에서 민감도는 약 0.80, 특이도는 약 0.85였습니다. 다른 인구 집단, 다른 질문 세트로 HADS와 대체로 비슷했습니다. PHQ-9는 또한 자살 사고에 관한 마지막 항목을 포함하는데, 이것이 임상의들이 그 항목이 없는 선별 도구보다 PHQ-9를 자주 선호하는 한 가지 이유입니다.

GAD-7은 Spitzer, Kroenke, Williams, Löwe가 2006년 Archives of Internal Medicine 에 병행 불안 도구로 발표했습니다.⁴ 일곱 항목, 같은 0~3 척도, 총점 0~21, 구간은 0~4 최소, 5~9 경도, 10~14 중등도, 15~21 중증입니다. 원래 검증 연구는 범불안장애에 대한 구조화 면담 대비 절단점 10에서 민감도 0.89, 특이도 0.82를 보고했고, 이 설문지는 공황, 사회불안, PTSD의 표시로도 꽤 잘 작동했습니다. 다시 말해, GAD를 구체적으로 잡아내기보다 불안한 무언가 를 더 신뢰할 만하게 잡아냅니다.

선별 도구가 무엇에 좋고, 무엇에 그렇지 않은가

선별 도구는 대화의 시작으로서 유용합니다. 절단점 이상의 점수는 그 질문을 일반의나 치료사에게 가져갈 구조화된 이유이며, 수치가 붙어 있고, 임상의가 즉시 알아볼 형식으로 되어 있습니다. 추적기로서도 유용합니다. 같은 주기로 몇 주 혹은 몇 달에 걸쳐 측정한 점수는 상황이 나아지는지, 나빠지는지, 평평하게 유지되는지를 보여줍니다.

선별 도구는 자가 진단으로는 유용하지 않습니다. 이름이 그런 오독을 부추기지만, 검증 논문들은 그것을 명시적으로 지지하지 않습니다. 진단에는 임상의가 병력을 청취하고, 의학적 원인을 배제하고, 시간에 걸친 패턴을 평가하는 일이 필요합니다. 0.80 특이도라는 수치가 이미 그만큼을 시사합니다. 상태를 가지지 않은 사람 다섯 중 대략 한 명은 여전히 절단점 이상의 점수를 받으므로, 양성 선별 결과는 누군가와 이야기할 이유이지 판결이 아닙니다.

선별 도구는 또한 활동성 위기 상황에서는 유용하지 않습니다. PHQ-9 9번 항목은 자해 사고를 묻지만, 설문지는 즉각적인 도움을 대신하지 못합니다. 그 항목에 대한 답이 "전혀 아님" 외의 무엇이라면, 올바른 다음 단계는 검사를 다시 하는 것이 아니라 사람과 이야기하는 것입니다.

패턴이 단일 점수를 이긴다

나쁜 오후에 받은 단일 PHQ-9 점수는 대부분 잡음입니다. 질문은 지난 2주를 묻지만, 설문지를 작성하는 행위는 작성 순간의 기분, 기억 편향, 그날 아침에 막 일어난 일에 의해 형성됩니다. 여러 차례 시행에 걸친 추세가 어떤 단일 결과보다 훨씬 많은 정보를 담습니다.

측정 기반 진료를 하는 대부분의 CBT 치료사는 적극적 치료 중 2~4주마다 PHQ-9와 GAD-7을 시행하고, 절대 점수가 아니라 궤적을 사용해 작업이 진척되는지 판단합니다. 자가 시행 추적에도 같은 논리가 적용됩니다. 6개월간 안정적으로 유지된 경계 범위의 점수는 6주간 오르고 있는 경계 범위의 점수와는 다른 정보이며, 그중 하나만 경보입니다.

Colors는 HADS를 어떻게 사용하는가

Colors는 표준 HADS 설문지를 검사 섹션 아래에, Zigmond와 Snaith의 원래 절단점에 맞춘 정상 / 경계 / 임상 구간으로 포함합니다.¹ 의도는 설문지가 설계된 목적과 같습니다. 특히 무언가 잘못된 느낌이 들지만 그것이 상황적인지 지속적인지 분명하지 않을 때, 주기적으로 점검하는 구조화된 방법입니다.

Colors의 단일 HADS 결과는 진단이 아닙니다. 점수가 경계 또는 임상 범위에 있으면 일반의나 치료사에게 가져갈 수 있는 정보이거나, 패턴이 안정적인지 보고 싶으면 2~4주 후에 반복할 수 있는 정보입니다. 구조화된 개입의 일부로서의 자기 모니터링에 대한 더 넓은 논거와 그에 대한 근거가 실제로 어디에 있는지는 기분 추적 연구 리뷰에 있습니다.

자주 묻는 질문

검증된 정신 건강 선별 도구란 무엇인가요?

검증된 선별 도구란, 정해진 인구 집단에서 특정 상태를 합리적으로 잘 탐지함을 보여주는 출판된 연구를 가진 짧은 설문지입니다. 병원 불안 우울 척도(HADS)는 Zigmond와 Snaith가 1983년에 발표했고, PHQ-9는 Kroenke 등이 2001년에, GAD-7은 Spitzer 등이 2006년에 발표했습니다. 각각은 임상 기준 표준에 대조해 검증되었고, 알려진 민감도와 특이도를 가집니다. 선별 도구는 진단이 아닙니다 — 무언가가 더 면밀한 임상적 검토를 받을 만한지 표시하는 구조화된 방법입니다.

높은 HADS 점수는 무엇을 뜻하나요?

Zigmond와 Snaith의 원래 1983년 절단점은 각 하위 척도를 0~7(정상), 8~10(경계), 11 이상(임상)으로 나눕니다. Bjelland의 2002년 747개 연구 리뷰는 표준 절단점에서 불안 및 우울 하위 척도 모두 민감도와 특이도가 약 0.80임을 발견했습니다. 경계 또는 임상 범위의 점수는 증상이 임상적 대화를 나눌 가치가 있다는 뜻이지, 진단이 확정되었다는 뜻이 아닙니다.

PHQ-9와 GAD-7이 HADS보다 나은가요?

겹치지만 조금 다른 것을 측정합니다. HADS는 비정신과 병원 외래 환자를 위해 설계되었고 신체 질환과 겹치는 신체 증상 항목을 의도적으로 뺍니다. PHQ-9는 DSM 우울 기준에 직접 대응됩니다. GAD-7은 1차 진료의 범불안을 위해 설계되었습니다. 어느 것도 보편적으로 더 낫지 않습니다 — 각각 검증된 인구 집단이 있습니다. Mitchell의 2016년 1차 진료 연구 40건 메타분석은 표준 절단점 10에서 PHQ-9 민감도 약 0.80, 특이도 약 0.85를 발견했습니다.

선별 도구가 저를 진단할 수 있나요?

아니요. 이름이 오해를 부릅니다 — GAD-7은 "범불안장애 7문항 척도(Generalized Anxiety Disorder 7-item scale)"로 진단처럼 들리지만, 원래 Spitzer 2006 논문은 이것이 진단 검사가 아니라 선별 및 중증도 측정 도구임을 분명히 합니다. 높은 점수는 임상 평가를 고려하라는 뜻입니다. 진단을 만들어내는 것은 임상의의 면담, 병력, 다른 원인의 배제입니다.

선별 도구를 얼마나 자주 다시 해야 하나요?

대부분의 측정 기반 CBT 진료는 변화를 추적하기 위해 적극적 치료 중 2~4주마다 PHQ-9와 GAD-7을 시행합니다. 치료 밖의 자기 모니터링에도 비슷한 간격이 합리적입니다. 질문이 지난 2주를 묻기 때문에, 매일 다시 하는 것은 신호 없이 잡음만 더합니다. 단일 점수 하나는 그 자체로 정보가 되는 경우가 드뭅니다. 정보를 주는 것은 여러 차례 시행에 걸친 추세입니다.

의학적 조언이 아닙니다

이 글은 정보 제공 및 교육 목적으로만 작성되었습니다. 의학적 조언이 아니며, 면허를 가진 정신건강 전문가와의 상담을 대신할 수 없습니다. 위기 상황이라면 즉시 거주 국가의 응급 서비스에 연락하십시오.

위기 상담 전화: 대한민국 — 자살예방 상담전화 109 · 국제 — Befrienders Worldwide

최종 검토: 2026년 5월.

참고 문헌

Zigmond, A. S., & Snaith, R. P. (1983). The Hospital Anxiety and Depression Scale. Acta Psychiatrica Scandinavica, 67(6), 361–370. doi:10.1111/j.1600-0447.1983.tb09716.x
Bjelland, I., Dahl, A. A., Haug, T. T., & Neckelmann, D. (2002). The validity of the Hospital Anxiety and Depression Scale: An updated literature review. Journal of Psychosomatic Research, 52(2), 69–77. doi:10.1016/S0022-3999(01)00296-3
Kroenke, K., Spitzer, R. L., & Williams, J. B. (2001). The PHQ-9: Validity of a brief depression severity measure. Journal of General Internal Medicine, 16(9), 606–613. doi:10.1046/j.1525-1497.2001.016009606.x
Spitzer, R. L., Kroenke, K., Williams, J. B., & Löwe, B. (2006). A brief measure for assessing generalized anxiety disorder: the GAD-7. Archives of Internal Medicine, 166(10), 1092–1097. doi:10.1001/archinte.166.10.1092
Mitchell, A. J., Yadegarfar, M., Gill, J., & Stubbs, B. (2016). Case finding and screening clinical utility of the Patient Health Questionnaire (PHQ-9 and PHQ-2) for depression in primary care: a diagnostic meta-analysis of 40 studies. BJPsych Open, 2(2), 127–138. doi:10.1192/bjpo.bp.115.001685