Therapie

Funktionieren Apps für psychische Gesundheit wirklich? Ein Forschungsüberblick

Eine ehrliche Bestandsaufnahme der metaanalytischen Evidenz zu Apps für psychische Gesundheit – was sie verlässlich leisten, was die Werbung überverkauft und welche Funktionen echte Effekte vorhersagen.

Apps für psychische Gesundheit sind überall. Die App-Stores listen mehr als zehntausend davon, beworben für alles von Schlaf über Trauer bis Schizophrenie. Die Forschungsbasis hinter diesem Katalog ist viel kleiner, und ein sorgfältiger Blick darauf ergibt ein weniger dramatisches Bild, als die Werbetexte suggerieren. Apps wirken im Durchschnitt etwas besser als nichts und deutlich schlechter als eine kompetente Therapeutin. Der ehrliche Artikel zur Frage, ob Apps für psychische Gesundheit wirken, ist meist ein Artikel über Effektstärken, Vergleichsgruppen und Nutzungstreue.

Das Ausmaß der Lücke zwischen Werbung und Evidenz

Beginnen wir mit der Lücke. Larsen und Kollegen gingen die wissenschaftlich klingenden Aussagen durch, die Mental-Health-Apps in den App-Stores machen, und prüften sie gegen veröffentlichte Evidenz.6 Die meisten Aussagen waren vage („klinisch validiert“, „evidenzbasiert“), bezogen sich auf allgemeine wissenschaftliche Prinzipien statt auf das konkrete Produkt oder verwiesen auf Studien, die gar nicht mit der verkauften App durchgeführt worden waren. Nur eine kleine Minderheit der Apps hatte überhaupt Daten aus randomisierten Studien. Das ist die Ausgangslage. Wenn jemand fragt, ob Apps für psychische Gesundheit wirken, hängt die Antwort fast vollständig davon ab, welche App, wie genutzt, von wem.

Die andere Ausgangslage ist, dass „Mental-Health-App“ eine Kategorie ist, so breit wie „Buch“. Ein Meditationstimer, ein KVT-Gedankenprotokoll-Journal, ein KI-Chatbot, ein Symptomtracker für bipolare Störung und ein angeleitetes Selbsthilfeprogramm für postnatale Depression sind alle „Mental-Health-Apps“. Aggregierte Effektstärken über diese Kategorie sind als Plausibilitätsprüfung der Werbung nützlich, nicht als Leitfaden dafür, was ein bestimmtes Werkzeug für eine bestimmte Person tun wird.

Was die Meta-Analysen tatsächlich finden

Die meistzitierte Zahl dieses Feldes stammt aus der Meta-Analyse von Linardon und Kollegen 2019 in World Psychiatry.1 Sechsundsechzig randomisierte kontrollierte Studien, rund 7.400 Teilnehmende, app-basierte Interventionen gegenüber verschiedenen Kontrollbedingungen. Die gepoolten Effekte waren klein bis mittel über Depression, generalisierte Angst, soziale Angst, Suizidalität, Stress und Lebensqualität hinweg, mit Hedges' g im Bereich von 0,20–0,45 je nach Outcome. Zwei Befunde in dieser Arbeit zählen mehr als die Schlagzeile. Die Effekte waren größer, wenn die App KVT-artige Komponenten nutzte, und größer, wenn die App als Ergänzung zur persönlichen Versorgung statt als alleinige Behandlung verwendet wurde.

Firth et al. 2017 betrachteten gezielt Depression in 18 Studien mit rund 3.400 Teilnehmenden und fanden eine standardisierte Mittelwertdifferenz um 0,38 gegenüber inaktiven Kontrollbedingungen, die gegenüber aktiven Vergleichsgruppen schrumpfte.3 Ihre parallele Angst-Meta-Analyse, neun Studien, lag bei etwa 0,33 mit demselben Muster: ein realer, aber bescheidener Effekt, größer, wenn die Vergleichsgruppe nichts tat.4

Goldberg et al. 2022 gingen eine Ebene höher und fassten 14 Meta-Analysen zu Mobiltelefon-Interventionen über Outcomes der psychischen Gesundheit hinweg zusammen.2 Die Schlussfolgerung dieser Meta-Übersicht ist die, die man sich merken sollte. Smartphone-Interventionen übertreffen inaktive Kontrollgruppen (Warteliste, keine Behandlung) verlässlich, schlagen aber selten aktive Vergleichsgruppen (eine generische Wellness-App, persönliche Therapie, strukturierte Psychoedukation). Das Signal ist real. Groß ist es nicht.

Was das im Klartext bedeutet

Apps wirken besser als nichts. Sie sind anderen niedrigschwelligen Interventionen wie Bibliotherapie oder angeleiteter Selbsthilfe grob ebenbürtig. Sie ersetzen die Therapie bei klinisch relevanten Zuständen nicht. Die Effektstärken sind klinisch bescheiden, nicht magisch.

Die andere Hälfte des Bildes ist die Nutzungstreue. Die Abbruchquote auf Studienebene wirkt vernünftig, weil die Teilnehmenden ausgewählt, bezahlt und erinnert werden. Die Nutzungstreue in der realen Welt ist düster. Über mehrere Analysen hinweg hören 70–90 % der Menschen, die eine Mental-Health-App herunterladen, innerhalb von zwei Wochen auf, sie zu nutzen. Eine App, die in einer 12-wöchigen Studie ein g von 0,4 erzielt, bringt jemandem, der sie neun Tage nutzt, sehr wenig. Die Zahl, die im echten Leben zählt, ist nicht die Effektstärke der Studie; es ist die Effektstärke der Studie, multipliziert damit, ob du die App tatsächlich öffnest.

Was die Apps, die wirken, von denen unterscheidet, die es nicht tun

Dieselben drei Prädiktoren tauchen immer wieder auf. Apps mit KVT-abgeleiteten Komponenten (Gedankenprotokolle, Impulse zur Verhaltensaktivierung, strukturierte Expositionsarbeit, geplante Stimmungs- und Emotionseinträge) erzielen stärkere Effekte als Apps, die um generische Wellness-Inhalte gebaut sind.12 Das ist das sauberste Signal der Literatur.

Der zweite Prädiktor ist menschlicher Kontakt, selbst minimaler. Sowohl bei Linardon 2019 als auch in der Goldberg-Meta-Übersicht erzielten Apps mit irgendeiner Form asynchroner menschlicher Begleitung – ein Coach, eine Therapeutin, die einmal pro Woche Notizen sichtet, eine Peer-Support-Ebene – Effekte etwa doppelt so groß wie vollständig selbstgesteuerte Apps. „Angeleitete Selbsthilfe“ ist der historische Begriff, und er verdient seinen Namen. Ein wenig Verbindlichkeit verändert Ergebnisse stärker als die meisten Funktionserweiterungen.

Der dritte Prädiktor ist konsequente Nutzung. Das klingt offensichtlich, bis man bemerkt, wie stark App-Design auf die Neuheit der ersten Woche statt auf die Bindung in Woche sechs optimiert. Streaks helfen manchen Nutzern und entmutigen andere. Benachrichtigungen bringen abnehmenden Ertrag und schlicht Ermüdung. Die Apps, die in den Meta-Analysen mit positiven Effekten auftauchen, sind meist die, die Menschen wiederholt öffnen, ohne aufgesetzte Ermunterung.

Wohin sich das Feld bewegt

Die Übersicht von Torous und Kollegen 2021 in World Psychiatry kartiert die nächste Welle: KI-Chatbots, passive Sensorik aus Telefonsensoren, integrierte Plattformen, die sich mit Klinikern abstimmen, Expositionstherapie in virtueller Realität.5 Jede davon hat erste stützende Daten und erheblich mehr Begeisterung als Daten. Chatbot-Studien sind klein und kurz. Stimmungsvorhersage aus passiver Sensorik ist technisch interessant und auf individueller Ebene klinisch unbelegt. Integrierte Plattformen wirken in den Studien, die sie durchführen, und wurden noch nicht im großen Maßstab getestet.

Die vernünftige Lesart der Torous-Übersicht ist, dass die Richtungen sinnvoll sind und die Evidenz noch nicht da ist. Wer heute eine App auswählt, sollte die Wahl auf den metaanalytisch gesicherten Boden stützen, und das sind schlichte, konsequent genutzte KVT-Apps, mit leichtem menschlichem Kontakt, falls verfügbar.

Vernünftige Erwartungen für Nutzer

Bei leichten bis mittelschweren Symptomen wird eine App mit KVT-Komponenten, ein paar Mal pro Woche genutzt, wahrscheinlich ein wenig helfen. Der ehrliche Vergleich lautet „mehr als Tagebuchschreiben auf Papier, weniger als Therapie“. Das ist ein nützlicher Platz für Selbsterkenntnis, Hausaufgaben zwischen den Sitzungen und das Verfolgen von Mustern über Wochen.

Bei schwerer Depression, akuter Suizidalität, PTBS, Zwangsstörung oder Psychose ist eine App keine geeignete Primärbehandlung. Die Meta-Analysen zeigen keine Effekte dieser Größenordnung, und die Studien schlossen diese Gruppen weitgehend aus. Der richtige Schritt dort ist eine Klinikerin.

Colors deckt die Komponenten ab, die die Meta-Analysen als tragend ausweisen – granulare Emotionsbenennung, KVT-artige Gedankenprotokolle, strukturiertes Tagebuchschreiben zwischen den Sitzungen – und hält sich aus dem Terrain heraus, in dem die Daten am schwächsten sind, nämlich Chatbot-„KI-Therapeuten“ und Stimmungsvorhersage. Die ehrliche Aussage: eine nützliche Ergänzung, keine Behandlung für sich.

Häufige Fragen

Funktionieren Apps für psychische Gesundheit wirklich?

Im Durchschnitt ja – bescheiden. Die bislang größte Meta-Analyse, Linardon et al. 2019 in World Psychiatry, fasste 66 randomisierte kontrollierte Studien mit rund 7.400 Teilnehmenden zusammen und fand kleine bis mittlere Effekte auf Depression, Angst, Stress, Suizidalität und Lebensqualität. Die Effekte waren am größten, wenn die Apps KVT-artige Techniken nutzten und wenn die App den Kontakt zu einer Klinikerin unterstützte, statt ihn zu ersetzen. Gegenüber aktiven Kontrollgruppen fielen sie kleiner aus als gegenüber Wartelisten, und die Nutzungstreue außerhalb von Studien ist viel geringer als innerhalb.

Wie groß ist die Lücke zwischen Werbeversprechen und Evidenz?

Groß. In den App-Stores gibt es über 10.000 Apps, die für psychische Gesundheit beworben werden, und nur ein kleiner Bruchteil hat überhaupt Daten aus randomisierten Studien hinter sich. Eine Bewertung von 2019 in npj Digital Medicine prüfte die wissenschaftlichen Aussagen von Mental-Health-Apps im Google Play Store und App Store und fand, dass die meisten Aussagen entweder vage, durch veröffentlichte Evidenz nicht gestützt oder auf allgemeine wissenschaftliche Prinzipien statt auf die konkrete App bezogen waren.

Sind Apps ein Ersatz für Therapie?

Nein. Über mehrere Meta-Analysen hinweg sind Smartphone-Interventionen anderen niedrigschwelligen Interventionen ebenbürtig und schlagen das Nichtstun, aber sie übertreffen die persönliche Therapie bei klinisch relevanter Depression, Angst oder PTBS nicht. Die sinnvolle Rahmung ist Ergänzung, nicht Ersatz – Hausaufgaben zwischen den Sitzungen, Tagebuch, Stimmungstracking und Psychoedukation, mit einer Klinikerin im Hintergrund für alles Ernste.

Welche Funktionen unterscheiden Apps, die wirken, von solchen, die es nicht tun?

Drei Dinge, ziemlich einheitlich über die Meta-Analysen hinweg. Erstens sagen KVT-abgeleitete Komponenten – Gedankenprotokolle, Verhaltensaktivierung, Expositionsimpulse – größere Effekte voraus als unspezifische Wellness-Inhalte. Zweitens verdoppelt selbst kurzer asynchroner menschlicher Kontakt die Effektstärken gegenüber rein selbstgesteuerter Nutzung grob. Drittens schlägt anhaltende Nutzung clevere Einmal-Funktionen; die meisten Nutzer geben Apps innerhalb von zwei Wochen auf, und die Apps, die Aufmerksamkeit halten, halten meist auch den Effekt.

Was ist mit KI-Chatbots und Stimmungsvorhersage?

Frühe Evidenz, viel schmaler als die Evidenzbasis für app-vermittelte KVT. Die Übersicht von Torous et al. 2021 in World Psychiatry behandelt Chatbots, passive Sensorik und integrierte Plattformen als vielversprechende Richtungen, bei denen die Daten der Werbung noch nicht hinterherkommen. Begegne starken Aussagen hier mit Vorsicht; der metaanalytisch gesicherte Boden liegt bei schlichten, konsequent genutzten KVT-Apps.

Kein medizinischer Rat

Dieser Artikel dient ausschließlich Informations- und Bildungszwecken. Er stellt keinen medizinischen Rat dar und ersetzt nicht die Beratung durch eine zugelassene Fachkraft für psychische Gesundheit. Wenn Sie sich in einer Krise befinden, wenden Sie sich bitte umgehend an den Notdienst in Ihrem Land.

Krisen-Hotlines: Deutschland — TelefonSeelsorge 0800 111 0 111 · Österreich — Telefonseelsorge 142 · International — Befrienders Worldwide

Zuletzt überprüft: Mai 2026.

Quellen

  1. Linardon, J., Cuijpers, P., Carlbring, P., Messer, M., & Fuller-Tyszkiewicz, M. (2019). The efficacy of app-supported smartphone interventions for mental health problems: a meta-analysis of randomized controlled trials. World Psychiatry, 18(3), 325–336. doi:10.1002/wps.20673
  2. Goldberg, S. B., Lam, S. U., Simonsson, O., Torous, J., & Sun, S. (2022). Mobile phone-based interventions for mental health: A systematic meta-review of 14 meta-analyses of randomized controlled trials. PLOS Digital Health, 1(1), e0000002. doi:10.1371/journal.pdig.0000002
  3. Firth, J., Torous, J., Nicholas, J., Carney, R., Pratap, A., Rosenbaum, S., & Sarris, J. (2017). The efficacy of smartphone-based mental health interventions for depressive symptoms: a meta-analysis of randomized controlled trials. World Psychiatry, 16(3), 287–298. doi:10.1002/wps.20472
  4. Firth, J., Torous, J., Nicholas, J., Carney, R., Rosenbaum, S., & Sarris, J. (2017). Can smartphone mental health interventions reduce symptoms of anxiety? A meta-analysis of randomized controlled trials. Journal of Affective Disorders, 218, 15–22. doi:10.1016/j.jad.2017.04.046
  5. Torous, J., Bucci, S., Bell, I. H., et al. (2021). The growing field of digital psychiatry: current evidence and the future of apps, social media, chatbots, and virtual reality. World Psychiatry, 20(3), 318–335. doi:10.1002/wps.20883
  6. Larsen, M. E., Huckvale, K., Nicholas, J., Torous, J., Birrell, L., Li, E., & Reda, B. (2019). Using science to sell apps: Evaluation of mental health app store quality claims. npj Digital Medicine, 2, 18. doi:10.1038/s41746-019-0093-1