療法

メンタルヘルスアプリは本当に効果があるのか — 研究レビュー

メンタルヘルスアプリのメタ分析のエビデンスを誠実にレビューします — 確実にできること、宣伝が誇張していること、そしてどんな機能が実際の効果を予測するか。

メンタルヘルスアプリはどこにでもあります。アプリストアには1万本以上が並び、睡眠から悲嘆、統合失調症まで、あらゆるものをうたって売られています。そのカタログの背後にある研究の蓄積はずっと小さく、それを注意深く読むと、宣伝文句が示唆するよりも地味な絵が浮かび上がります。アプリは平均として、何もしないよりは少し効き、有能なセラピストよりはかなり劣ります。メンタルヘルスアプリが効くかどうかについての誠実な記事は、ほとんどが効果量、比較対象、遵守についての記事になります。

宣伝とエビデンスの隔たりの大きさ

まず隔たりから始めましょう。Larsenらは、メンタルヘルスアプリがアプリストアで行う、科学風味の主張を一つ一つ調べ、発表されたエビデンスと照らし合わせました。6 ほとんどの主張は曖昧(「臨床的に検証済み」「エビデンスに基づく」)であるか、特定の製品ではなく一般的な科学的原理に言及したものであるか、あるいは販売されているアプリで実際には行われていない研究を指していました。何らかの無作為化試験データを持つアプリは、ごくわずかな少数派でした。これがベースラインです。メンタルヘルスアプリが効くかと誰かが尋ねるとき、その答えはほぼ完全に、どのアプリを、どう使い、誰が使うかにかかっています。

もう一つのベースラインは、「メンタルヘルスアプリ」が「本」と同じくらい広いカテゴリーだということです。瞑想タイマー、CBTの思考記録の日記、AIチャットボット、双極性障害の症状トラッカー、産後うつのためのガイド付きセルフヘルププログラムは、すべて「メンタルヘルスアプリ」です。このカテゴリーをまたいだ集計効果量は、宣伝に対する健全性チェックとしては有用ですが、特定の道具が特定の人に何をもたらすかの指針にはなりません。

メタ分析が実際に見出していること

この分野で最も引用される一つの数字は、Linardonらの2019年の World Psychiatry のメタ分析から来ています。1 66件の無作為化比較試験、約7,400人の参加者、アプリベースの介入とさまざまな対照条件の比較です。プールされた効果は、うつ、全般性不安、社交不安、自殺念慮、ストレス、生活の質にわたって小から中程度で、アウトカムによってHedgesの g が0.20〜0.45の範囲でした。この論文の中の二つの知見は、見出しよりも重要です。効果は、アプリがCBT風の要素を用いたときに大きく、また単独の治療としてではなく対面ケアの補完として用いられたときに大きくなりました。

Firthら2017年は、約3,400人の参加者を含む18件の試験でうつに特化して調べ、不活性の対照条件に対して標準化平均差が約0.38で、能動的な比較対象に対しては縮むことを見出しました。3 並行する不安のメタ分析(9件の試験)はおよそ0.33で、同じパターンでした。本物だが穏やかな効果で、比較対象が何もしないときに大きくなります。4

Goldbergら2022年は、もう一段高い水準で、メンタルヘルスのアウトカムにわたる携帯電話介入の14件のメタ分析をプールしました。2 このメタレビューの結論こそ、覚えておくべきものです。スマートフォン介入は不活性の対照群(待機リスト、無治療)を確実に上回りますが、能動的な比較対象(汎用のウェルネスアプリ、対面の療法、構造化された心理教育)に勝ることはまれです。シグナルは本物です。大きくはありません。

これが平易な言葉で意味すること

アプリは何もしないよりは効きます。読書療法や支援付きセルフヘルプのような、他の低強度の介入とおおむね同等です。臨床水準の状態に対して療法の代わりにはなりません。効果量は臨床的に穏やかで、魔法ではありません。

絵のもう半分は遵守です。試験レベルの脱落は、参加者がスクリーニングされ、報酬を受け、リマインドされるため、妥当に見えます。実世界の遵守は厳しいものです。複数の分析にわたって、メンタルヘルスアプリをダウンロードした人の70〜90%が2週間以内に使用をやめます。12週間の試験で g が0.4を生むアプリも、9日しか使わない人にはほとんど何もしません。実生活で重要な数字は、試験の効果量ではありません。試験の効果量に、あなたが実際にアプリを開くかどうかを掛けたものです。

効果のあるアプリとないアプリを分けるもの

同じ3つの予測因子が繰り返し現れます。CBT由来の要素(思考記録、行動活性化のプロンプト、構造化された曝露作業、予定された気分と感情の記録)を持つアプリは、汎用のウェルネスのコンテンツを中心に作られたアプリよりも強い効果を生みます。12 これは文献の中で最も明快なシグナルです。

第二の予測因子は、最小限であっても、人との接触です。Linardon 2019とGoldbergのメタレビューの両方にわたって、何らかの形の非同期の人による誘導 — コーチ、週に一度メモを確認するセラピスト、ピアサポートの層 — を持つアプリは、完全に自己誘導のアプリのおよそ2倍の効果量を生みました。「ガイド付きセルフヘルプ」が歴史的な用語であり、その名にふさわしいものです。わずかな責任感が、ほとんどの機能追加よりもアウトカムを変えます。

第三の予測因子は、継続的な利用です。これは当たり前に聞こえますが、いかに多くのアプリ設計が、6週目の継続ではなく初週の目新しさに最適化されているかに気づくまでのことです。連続記録は一部の利用者を助け、別の利用者を意気消沈させます。通知は収穫逓減と、あからさまな疲労を生みます。メタ分析で良い効果とともに現れるアプリは、見せかけの励ましなしに人が繰り返し開くものである傾向があります。

この分野が向かう先

2021年の World Psychiatry のTorousらによるレビューは、次の波を地図にしています。AIチャットボット、スマートフォンのセンサーからの受動的センシング、臨床家と連携する統合プラットフォーム、VR曝露です。5 これらにはそれぞれ初期の支持データがありますが、データよりもかなり多くの熱意があります。チャットボットの研究は小規模で短いものです。受動的センシングからの気分予測は技術的には興味深いものの、個人レベルでは臨床的に実証されていません。統合プラットフォームは、実施された試験では機能しますが、大規模にはまだ検証されていません。

Torousのレビューの妥当な読み方は、方向性は理にかなっているが、エビデンスはまだそこにない、というものです。今日アプリを選ぶ消費者は、メタ分析の地盤に基づいて選ぶべきであり、それは一貫して使われる素朴なCBT風アプリで、可能であれば軽い人との接触を伴うものです。

利用者にとって妥当な期待

軽度から中等度の症状であれば、CBTの要素を持つアプリを週に数回使えば、おそらく少しは役立つでしょう。誠実な比較対象は「紙の日記以上、療法未満」です。これは自己認識、セッション間の宿題、数週間にわたるパターンの追跡のために埋める価値のある位置づけです。

重度のうつ、活動的な自殺念慮、PTSD、OCD、精神病に対しては、アプリは適切な主たる治療ではありません。メタ分析はその規模の効果を示しておらず、試験はこうした集団をほぼ除外していました。そこで正しい一手は、臨床家です。

Colors は、メタ分析が支柱と特定する要素 — 粒度の高い感情のラベリング、CBT風の思考記録、構造化されたセッション間の日記 — を取り入れ、データが最も弱い領域、すなわちチャットボットの「AIセラピスト」や気分予測には踏み込みません。誠実な主張はこうです。役立つ補助ではあるが、それ自体が治療ではない、ということです。

よくある質問

メンタルヘルスアプリは本当に効果がありますか?

平均としては、はい — 控えめにですが。これまでで最大のメタ分析であるLinardonら2019年のWorld Psychiatry掲載の研究は、約7,400人の参加者を含む66件の無作為化比較試験をプールし、うつ、不安、ストレス、自殺念慮、生活の質に対して小から中程度の効果を見出しました。効果が最も大きかったのは、アプリがCBT風の技法を用い、臨床家との接触を置き換えるのではなく支える形をとったときでした。効果は待機リストと比べたときよりも能動的な対照群と比べたときのほうが小さく、試験の外での遵守は試験内よりもはるかに低くなります。

宣伝の主張とエビデンスの隔たりはどれほどありますか?

大きいです。アプリストアにはメンタルヘルスをうたうアプリが1万本以上ありますが、その背後に何らかの無作為化試験データを持つものはごく一部にすぎません。2019年のnpj Digital Medicineの評価は、Google PlayとApp Storeのメンタルヘルスアプリが行った科学的主張をレビューし、ほとんどの主張が曖昧であるか、発表されたエビデンスに裏付けられていないか、あるいは特定のアプリではなく一般的な科学的原理に言及したものであることを見出しました。

アプリは療法の代わりになりますか?

なりません。複数のメタ分析にわたって、スマートフォン介入は他の低強度の介入に匹敵し、何もしないことには勝りますが、臨床水準のうつ、不安、PTSDに対して対面の療法を上回ることはありません。妥当な位置づけは、代替ではなく補助です — セッション間の宿題、日記、気分の記録、心理教育であり、深刻なものについては臨床家を関与させるべきです。

効果のあるアプリとないアプリを分けるのは、どんな機能ですか?

メタ分析を通じてかなり一貫して、3つあります。第一に、CBT由来の要素 — 思考記録、行動活性化、曝露のプロンプト — は、非特異的なウェルネスのコンテンツよりも大きな効果を予測します。第二に、短時間でも非同期の人との接触があれば、完全に自己誘導の利用に比べて効果量がおよそ2倍になります。第三に、巧妙な一回限りの機能よりも、継続的な利用が勝ります。ほとんどの利用者は2週間以内にアプリをやめてしまい、注意を引き留められるアプリは効果も引き留める傾向があります。

AIチャットボットや気分予測についてはどうですか?

初期段階のエビデンスであり、アプリで提供されるCBTのエビデンス基盤よりもはるかに小さいものです。2021年のTorousらのWorld Psychiatryのレビューは、チャットボット、受動的センシング、統合プラットフォームを、データがまだ宣伝に追いついていない有望な方向として扱っています。ここでの強い主張は慎重に扱ってください。メタ分析の地盤は、一貫して使われる素朴なCBT風アプリにあります。

これは医療アドバイスではありません

この記事は情報提供および教育のみを目的としています。医療アドバイスではなく、資格を持つ メンタルヘルスの専門家への相談に代わるものではありません。危機的な状況にある場合は、 直ちにお住まいの国の救急サービスに連絡してください。

危機相談窓口: 日本 — よりそいホットライン 0120-279-338 · 国際 — Befrienders Worldwide

最終確認: 2026年5月。

参考文献

  1. Linardon, J., Cuijpers, P., Carlbring, P., Messer, M., & Fuller-Tyszkiewicz, M. (2019). The efficacy of app-supported smartphone interventions for mental health problems: a meta-analysis of randomized controlled trials. World Psychiatry, 18(3), 325–336. doi:10.1002/wps.20673
  2. Goldberg, S. B., Lam, S. U., Simonsson, O., Torous, J., & Sun, S. (2022). Mobile phone-based interventions for mental health: A systematic meta-review of 14 meta-analyses of randomized controlled trials. PLOS Digital Health, 1(1), e0000002. doi:10.1371/journal.pdig.0000002
  3. Firth, J., Torous, J., Nicholas, J., Carney, R., Pratap, A., Rosenbaum, S., & Sarris, J. (2017). The efficacy of smartphone-based mental health interventions for depressive symptoms: a meta-analysis of randomized controlled trials. World Psychiatry, 16(3), 287–298. doi:10.1002/wps.20472
  4. Firth, J., Torous, J., Nicholas, J., Carney, R., Rosenbaum, S., & Sarris, J. (2017). Can smartphone mental health interventions reduce symptoms of anxiety? A meta-analysis of randomized controlled trials. Journal of Affective Disorders, 218, 15–22. doi:10.1016/j.jad.2017.04.046
  5. Torous, J., Bucci, S., Bell, I. H., et al. (2021). The growing field of digital psychiatry: current evidence and the future of apps, social media, chatbots, and virtual reality. World Psychiatry, 20(3), 318–335. doi:10.1002/wps.20883
  6. Larsen, M. E., Huckvale, K., Nicholas, J., Torous, J., Birrell, L., Li, E., & Reda, B. (2019). Using science to sell apps: Evaluation of mental health app store quality claims. npj Digital Medicine, 2, 18. doi:10.1038/s41746-019-0093-1