Terapia

Instrumentos validados de triagem em saúde mental — o que HADS, PHQ-9 e GAD-7 realmente medem

Um guia em linguagem simples sobre instrumentos validados de triagem em saúde mental — HADS, PHQ-9 e GAD-7 — o que medem, o que seus escores significam e como usá-los com honestidade.

Um instrumento validado de triagem é um questionário curto com um estudo publicado por trás mostrando que, em média, ele consegue distinguir as pessoas com uma dada condição daquelas sem ela a uma taxa conhecida de erro. Essa é uma alegação mais estreita do que faz a maior parte do marketing de apps, e muito mais estreita do que sugerem os títulos dos questionários. A «escala de 7 itens para Transtorno de Ansiedade Generalizada» não diagnostica o transtorno de ansiedade generalizada. Cada um é um instrumento de triagem com sensibilidade, especificidade e uma população em que foi testado, todas publicadas.

Os três instrumentos de triagem que aparecem com mais frequência no uso clínico, na pesquisa e nos apps são HADS, PHQ-9 e GAD-7. O Colors inclui a HADS padrão em sua seção de Testes, com os mesmos pontos de corte do artigo original de 1983.

O que é um instrumento validado de triagem

Um questionário se torna «validado» quando pesquisadores o testam contra um padrão de referência clínico (em geral, uma entrevista diagnóstica estruturada feita por um clínico treinado) e relatam com que frequência os dois concordam. Dois números fazem a maior parte do trabalho. A sensibilidade é a proporção de pessoas com a condição que o instrumento sinaliza corretamente. A especificidade é a proporção de pessoas sem a condição que ele corretamente deixa de fora. Há sempre um trade-off entre as duas em qualquer ponto de corte.

Os instrumentos aqui foram publicados em periódicos clínicos de referência: a HADS na Acta Psychiatrica Scandinavica,1 o PHQ-9 no Journal of General Internal Medicine,3 o GAD-7 nos Archives of Internal Medicine.4 Os artigos de validação são públicos, os pontos de corte estão documentados, e existem décadas de estudos de acompanhamento. É isso que os separa da longa cauda de questionários não validados pela internet.

HADS: como funciona e o que mede

A Escala Hospitalar de Ansiedade e Depressão foi desenhada por Zigmond e Snaith em 1983 para triar ansiedade e depressão em pacientes ambulatoriais de hospitais não psiquiátricos.1 O problema clínico que resolviam: a doença física e seus tratamentos produzem sintomas somáticos (sono ruim, baixa energia, mudança de peso) que se sobrepõem fortemente à depressão na maioria dos questionários de depressão da época. Um paciente clínico geral podia pontuar alto num instrumento de depressão simplesmente por estar fisicamente doente.

A HADS deixa os itens somáticos de fora. Ela tem 14 perguntas (sete para ansiedade, sete para depressão), cada uma pontuada de 0 a 3, dando uma faixa de 0 a 21 por subescala. O artigo original propôs três faixas por subescala: 0–7 normal, 8–10 limítrofe, 11 ou mais clínico. Esses pontos de corte ainda são os de uso padrão.

A revisão de 2002 de Bjelland e colegas, no Journal of Psychosomatic Research, reuniu 747 estudos que haviam usado a HADS nas duas décadas anteriores.2 Ao longo desse conjunto de trabalhos, as subescalas de ansiedade e de depressão mostraram, cada uma, sensibilidade e especificidade de cerca de 0,80 contra a entrevista clínica nos pontos de corte padrão. Ambas as subescalas se correlacionaram bem com outras medidas de ansiedade e depressão, e a estrutura de dois fatores (ansiedade vs depressão) se replicou entre populações. É um instrumento utilizável: não perfeito, mas bem caracterizado.

PHQ-9 e GAD-7

O módulo de depressão de 9 itens do Patient Health Questionnaire é construído diretamente a partir dos critérios do DSM-IV para depressão maior. Cada um dos nove itens mapeia um dos nove critérios diagnósticos, pontuado de 0 (nem um pouco) a 3 (quase todos os dias) ao longo das últimas duas semanas. Escore total de 0 a 27. O estudo de validação de 2001 de Kroenke, Spitzer e Williams relatou faixas padrão de gravidade (0–4 mínima, 5–9 leve, 10–14 moderada, 15–19 moderadamente grave, 20–27 grave) e um ponto de corte recomendado de 10 para avaliação adicional.3

A metanálise de 2016 de Mitchell e colegas reuniu 40 estudos de atenção primária do PHQ-9 contra a entrevista clínica.5 No ponto de corte de 10, a sensibilidade foi de cerca de 0,80 e a especificidade de cerca de 0,85: em linhas gerais semelhante à HADS, numa população diferente, com um conjunto de perguntas diferente. O PHQ-9 também inclui um item final sobre pensamentos suicidas, o que é uma das razões pelas quais os clínicos muitas vezes o preferem a um instrumento que não o tenha.

O GAD-7 foi publicado por Spitzer, Kroenke, Williams e Löwe em 2006 nos Archives of Internal Medicine como um instrumento paralelo para ansiedade.4 Sete itens, a mesma escala de 0 a 3, total de 0 a 21, com faixas de 0–4 mínima, 5–9 leve, 10–14 moderada, 15–21 grave. O estudo de validação original relatou sensibilidade de 0,89 e especificidade de 0,82 num ponto de corte de 10 contra uma entrevista estruturada para transtorno de ansiedade generalizada, e o questionário também teve desempenho razoável como sinalizador de pânico, ansiedade social e TEPT. Em outras palavras, ele capta algo ansioso de forma mais confiável do que capta o GAD especificamente.

Para que os instrumentos de triagem servem, e para que não servem

Um instrumento de triagem é útil como o início de uma conversa. Um escore acima do ponto de corte é uma razão estruturada para levar a questão a um clínico geral ou terapeuta, com um número anexado, em um formato que esse clínico reconhecerá de imediato. Também é útil como acompanhamento: escores medidos na mesma cadência, ao longo de semanas ou meses, mostram se as coisas estão melhorando, piorando ou se mantendo estáveis.

Um instrumento de triagem não é útil como autodiagnóstico. Os nomes convidam a essa leitura equivocada; os artigos de validação explicitamente não a respaldam. Um diagnóstico exige um clínico que colha o histórico, exclua causas médicas e avalie o padrão ao longo do tempo. A própria especificidade de 0,80 já implica isso: cerca de uma em cada cinco pessoas sem a condição ainda assim pontuará acima do ponto de corte, de modo que uma triagem positiva é uma razão para conversar com alguém, não um veredito.

Um instrumento de triagem também não é útil em crise ativa. O item 9 do PHQ-9 pergunta sobre pensamentos de autolesão, mas um questionário não substitui a ajuda imediata. Se a resposta a esse item for qualquer coisa que não «nem um pouco», o passo certo a seguir é conversar com uma pessoa, não refazer o teste.

O padrão vence o escore único

Um único escore do PHQ-9 obtido numa tarde ruim é, em sua maior parte, ruído. As perguntas se referem às últimas duas semanas, mas o ato de completar o questionário é moldado pelo humor no momento da resposta, pelo viés de recordação, pelo que acabou de acontecer naquela manhã. A tendência ao longo de várias aplicações carrega muito mais informação do que qualquer resultado isolado.

A maioria dos terapeutas de TCC que praticam o cuidado baseado em medição aplica o PHQ-9 e o GAD-7 a cada duas a quatro semanas durante o tratamento ativo, e usa a trajetória, não o escore absoluto, para decidir se o trabalho está avançando. A mesma lógica vale para o acompanhamento autoaplicado. Um escore na faixa limítrofe que esteve estável por seis meses é uma informação diferente de um escore na faixa limítrofe que vem subindo há seis semanas, e apenas um deles é um alarme.

Como o Colors usa a HADS

O Colors inclui o questionário HADS padrão na seção de Testes, com as faixas Normal / Limítrofe / Clínico correspondentes aos pontos de corte originais de Zigmond e Snaith.1 A intenção é a mesma para a qual o questionário foi desenhado: uma forma estruturada de fazer um check-in periódico, especialmente quando algo parece fora do lugar mas não está claro se é situacional ou persistente.

Um único resultado da HADS no Colors não é um diagnóstico. É uma informação que você pode levar a um clínico geral ou terapeuta se o escore estiver na faixa limítrofe ou clínica, ou repetir em duas a quatro semanas se quiser ver se o padrão é estável. O argumento mais amplo sobre o automonitoramento como parte de uma intervenção estruturada, e onde a evidência para isso realmente se situa, está na revisão sobre pesquisa em monitoramento de humor.

Perguntas frequentes

O que é um instrumento validado de triagem em saúde mental?

Um instrumento de triagem validado é um questionário curto com um estudo publicado mostrando que ele detecta razoavelmente bem uma condição em uma população definida. A Escala Hospitalar de Ansiedade e Depressão (HADS) foi publicada por Zigmond e Snaith em 1983; o PHQ-9, por Kroenke e colegas em 2001; o GAD-7, por Spitzer e colegas em 2006. Cada um foi testado contra um padrão de referência clínico, e cada um tem sensibilidade e especificidade conhecidas. Um instrumento de triagem não é um diagnóstico — é uma forma estruturada de sinalizar se algo merece um olhar clínico mais atento.

O que significa um escore alto na HADS?

Os pontos de corte originais de Zigmond e Snaith, de 1983, dividem cada subescala em 0–7 (normal), 8–10 (limítrofe) e 11+ (clínico). A revisão de 2002 de Bjelland, com 747 estudos, encontrou sensibilidade e especificidade em torno de 0,80 para as subescalas de ansiedade e de depressão nos pontos de corte padrão. Um escore na faixa limítrofe ou clínica significa que os sintomas merecem uma conversa clínica, não que um diagnóstico esteja confirmado.

O PHQ-9 e o GAD-7 são melhores que a HADS?

Eles medem coisas que se sobrepõem, mas são ligeiramente diferentes. A HADS foi desenhada para pacientes ambulatoriais de hospitais não psiquiátricos e deliberadamente deixa de fora itens somáticos que se sobrepõem à doença física. O PHQ-9 mapeia diretamente os critérios de depressão do DSM. O GAD-7 foi desenhado para ansiedade generalizada na atenção primária. Nenhum é universalmente melhor — cada um tem a população em que foi validado. A metanálise de 2016 de Mitchell, com 40 estudos de atenção primária, encontrou sensibilidade em torno de 0,80 e especificidade em torno de 0,85 para o PHQ-9 no ponto de corte padrão de 10.

Um instrumento de triagem pode me diagnosticar?

Não. Os nomes são enganosos — o GAD-7 é a «escala de 7 itens para Transtorno de Ansiedade Generalizada», o que soa diagnóstico, mas o artigo original de Spitzer, de 2006, é explícito ao dizer que é uma medida de triagem e gravidade, não um teste diagnóstico. Um escore alto significa considerar uma avaliação clínica. Uma entrevista com um clínico, o histórico e a exclusão de outras causas são o que produz um diagnóstico.

Com que frequência devo refazer um instrumento de triagem?

A maior parte do cuidado em TCC baseado em medição usa o PHQ-9 e o GAD-7 a cada 2 a 4 semanas durante o tratamento ativo, para acompanhar a mudança. Para automonitoramento fora da terapia, um intervalo semelhante é razoável. Refazer diariamente acrescenta ruído sem muito sinal, já que as perguntas se referem às últimas duas semanas. Um único escore raramente é informativo por si só; a tendência ao longo de várias aplicações é que importa.

Isto não é aconselhamento médico

Este artigo tem finalidade apenas informativa e educativa. Não constitui aconselhamento médico e não substitui a consulta com um profissional de saúde mental licenciado. Se você estiver em crise, entre em contato imediatamente com os serviços de emergência do seu país.

Linhas de apoio em crise: Brasil — CVV 188 · Internacional — Befrienders Worldwide

Última revisão: maio de 2026.

Referências

  1. Zigmond, A. S., & Snaith, R. P. (1983). The Hospital Anxiety and Depression Scale. Acta Psychiatrica Scandinavica, 67(6), 361–370. doi:10.1111/j.1600-0447.1983.tb09716.x
  2. Bjelland, I., Dahl, A. A., Haug, T. T., & Neckelmann, D. (2002). The validity of the Hospital Anxiety and Depression Scale: An updated literature review. Journal of Psychosomatic Research, 52(2), 69–77. doi:10.1016/S0022-3999(01)00296-3
  3. Kroenke, K., Spitzer, R. L., & Williams, J. B. (2001). The PHQ-9: Validity of a brief depression severity measure. Journal of General Internal Medicine, 16(9), 606–613. doi:10.1046/j.1525-1497.2001.016009606.x
  4. Spitzer, R. L., Kroenke, K., Williams, J. B., & Löwe, B. (2006). A brief measure for assessing generalized anxiety disorder: the GAD-7. Archives of Internal Medicine, 166(10), 1092–1097. doi:10.1001/archinte.166.10.1092
  5. Mitchell, A. J., Yadegarfar, M., Gill, J., & Stubbs, B. (2016). Case finding and screening clinical utility of the Patient Health Questionnaire (PHQ-9 and PHQ-2) for depression in primary care: a diagnostic meta-analysis of 40 studies. BJPsych Open, 2(2), 127–138. doi:10.1192/bjpo.bp.115.001685