Der "Mir-hat-die Homöopathie-aber-geholfen"-Fehlschluss

Lesedauer / Reading Time: 6 min

Zusammenfassung

Der Schluss von einer Wirkung auf die Ursache ist in der Medizin besonders heikel. Warum?
Drawing conclusions from an effect to a cause is particularly tricky in medicine. Why?

Das Bild zeigt als Methapher zum Text ein komplexes Zahnradsystem, das es nicht zulässt, auf einen Blick die Zusammenhänge von Ursachen und Wirkungen zu erfassen. — Ursache und Wirkung – alles ganz einfach…. ?!?

Wenn wir einen Artikel posten, der sich kritisch mit den Behauptungen einer bestimmten Therapierichtung wie der Homöopathie, einer alternativen Philosophie oder einem alternativen Beruf auseinandersetzt, ist es fast unvermeidlich, dass jemand in den Kommentaren auf die sorgfältige Betrachtung veröffentlichter wissenschaftlicher Belege mit einer Anekdote („kleine persönliche Geschichte“, „Einzelfallerfahrung“) kontert. Die Argumente laufen dabei im Allgemeinen auf ein „Bei mir hat es funktioniert, deshalb sind all eure wissenschaftlichen Nachweise und Plausibilitäten irrelevant“ hinaus.

Beide Bestandteile dieses Arguments sind falsch. Selbst wenn wir zugestehen, dass eine Behandlung bei einem Individuum gewirkt hat, wiegt das nicht die (sorgfältig beobachtete) Erfahrung aller Testpersonen in einer klinischen Untersuchung auf. Die zählen auch – die zählen sogar mehr, weil wir alle wichtigen Aspekte ihrer Geschichte überprüfen können.

Ich möchte mich aber auf den ersten Teil der Behauptung konzentrieren – den Anspruch, dass eine Behandlung für ein bestimmtes Individuum „gewirkt“ habe. Die meisten Leute definieren „gewirkt“ in etwa so: Sie begannen eine Behandlung, und danach ging es ihnen in irgendeiner Weise besser. Diese Definition ist aber in vielerlei Hinsicht problematisch.

Placeboeffekte sind keine Therapie

Vieles bezüglich der unterschiedlichen Auffassung darüber, wie man „Wirkung“ definiert, führt zum Placeboeffekt. Die allgemein wissenschaftlich akzeptierte Vorgehensweise ist es, daraus zu schließen, dass ein Eingriff funktioniert hat, wenn der gewünschte Effekt größer ist als bei Placebo. Wenn alle anderen Einflussgrößen kontrolliert wurden, dann ist der Eingriff die einzige Variable, auf die das verbesserte Ergebnis zurückgeführt werden kann. Das ist die grundlegende Logik einer doppelverblindeten, placebokontrollierten Studie (RCT).

Vertreter von „alternativen“ Therapien, die dazu neigen, in solchen Versuchen zu versagen, verwenden gerne das Argument, dass Placeboeffekte ebenfalls in Betracht gezogen werden sollten, nicht nur solche Effekte, die den Placeboeffekt übertreffen. Im Wesentlichen argumentiert man, dass es gleichgültig sei, wenn etwas als Placebo funktioniert, solange es nur wirkt.

Ein Problem liegt in der Annahme, dass eine Behandlung gewirkt hätte, nur weil man sich besser fühlt. Das ist der post-hoc-ergo-propter-hoc-Fehlschluss. Wir wissen nicht, was das Ergebnis bei den Betreffenden gewesen wäre, wenn sie die Therapie nicht gemacht hätten oder eine andere Therapie durchgeführt worden wäre. Auf diese Art und Weise sind viele Placeboeffekte einfach eine Illusion, aber kein realer Nutzen.

Regression zur Mitte – ein natürliches Phänomen

Auch die Regression zur Mitte erklärt bereits viel bezüglich der wahrgenommenen Verbesserungen. Menschen neigen dazu, sich dann behandeln zu lassen, wenn ihre Symptome am schlimmsten sind. Das bedeutet, dass sie sich wahrscheinlich allein durch Zufall wieder der mittleren Verteilung der Symptome annähern – oder die Beschwerden sich auf natürliche Weise verringern, was als Verbesserung interpretiert wird.

Das wird weiter unterstützt durch den Confirmation Bias. Symptome sind oft sehr komplex, variabel und subjektiv. Was als „besser“ gilt, kann im Nachhinein mit allem Möglichen erklärt werden. Bei Kopfschmerzen zum Beispiel gibt es mehrere Variablen, die man betrachten kann – Häufigkeit, Zeitdauer, Stärke, Reaktion auf Schmerzmittel, der Bedarf an Schmerzmitteln, der Grad der Beeinträchtigung und eine ganze Menge von damit verbundenen Symptomen, wie z. B. Übelkeit, verschwommenes Sehen usw.

Alle diese Eigenschaften des Kopfschmerzes können sich verändern und bieten damit die Möglichkeit, Rosinenpicken („cherry-picking“) zu betreiben und daraufhin dann eine „Wirkung“ zu beurteilen. Das ist genau der Grund, warum in einer klinischen Studie das Hauptergebnis festgelegt werden muss, bevor man die Daten erfasst. Ebenfalls aus diesem Grund misstrauen wir klinischen Studien, die eine Menge sekundärer Ergebnisse benutzen und behaupten, eine erfolgreiche Studie zu sein, wenn eines dieser sekundären Messkriterien sich gebessert hat.

Mit anderen Worten, der natürliche Verlauf einer Krankheit ergibt sehr wechselhafte Daten. Es macht wissenschaftlich keinen Sinn, nur die positiven Effekte aus dieser Datenmenge herauszupicken und dann zu erklären, dass die Behandlung in diesen Fällen gewirkt hätte. Das ist genauso, als würde ein Hellseher Karten zu Rate ziehen und dabei natürlich nichts besseres als Zufall erzielen, danach aber zu behaupten, dass die gelandeten Treffer nur seinen psychischen Fähigkeiten zuzuschreiben wären. Man muss die gesamte Datenmenge betrachten, um herauszufinden, ob es einen Effekt gab.

Viele Einzelerfahrungen zusammen ergeben Studien

Dieses Prinzip gilt auch für medizinische Eingriffe – man muss systematisch alle Daten betrachten, um herauszufinden, ob es einen Effekt gab. Zu sagen „Bei mir hat es funktioniert“ ist genauso wie zu behaupten, dass die psychischen Kräfte funktioniert haben, wann immer wir einen Zufallstreffer landen. Sogar dann noch, wenn das Gesamtergebnis negativ war (also einfach mit dem Zufall übereinstimmte).

Eine andere Art der Zufälligkeit der Daten, die sich dann für das „cherry-picking“ und den Confirmation Bias anbietet, ist es, mehrere Therapien für dasselbe Problem anzuwenden (wie auch eine Therapie auf mehrere Probleme). Z. B. jemand nimmt Medikamente und wendet gleichzeitig Akupunktur, Chiropraktik und Homöopathie an, um seine Kopfschmerzen zu behandeln – wenn diese besser werden, wird das nach „Gefühl“ auf eine oder mehrere dieser Behandlungsalternativen zurückgeführt. Oder man versucht vielleicht diese Behandlungsformen nacheinander und was auch immer gerade in dem Moment angewandt wurde, als die Symptome sich von alleine verbessert haben: dieser Methode wird dann der Erfolg zugeschrieben als post-hoc-Fehlschluss.

Intuitiv ignoriert man die Behandlungen, die nicht funktioniert haben und begeht den Lotterie-Fehlschluss, indem man die falsche Frage stellt: Wie stehen die Chancen, dass mein Kopfschmerz kurz nach der Behandlung X besser wird? Aber die richtige Frage ist: Wie stehen die Chancen, dass mein Kopfschmerz zu irgendeiner Zeit besser wird und ich kurz davor zufällig irgendeine Behandlung ausprobiert habe?

Die Psyche entscheidet mit

Es spielen auch psychologische Faktoren eine Rolle. Wenn Menschen eine unkonventionelle Behandlung ausprobieren, möglicherweise aus Verzweiflung oder einfach aus der Hoffnung auf Verbesserung heraus, fürchten sie Kritik oder glauben, sich verteidigen zu müssen. Gerade auch dann, wenn sie irgendetwas Ungewöhnliches ausprobiert haben, vielleicht sogar etwas Bizarres. Daher scheint es lohnenswerter, die Entscheidung zu verteidigen, indem man schlussfolgert, dass die Behandlung funktioniert hat – um allen Skeptikern zu zeigen, dass man doch recht hatte.

Vermischt mit all diesem erzielt man dann tatsächlich eine Verbesserung der Stimmung und damit der Symptome aus der positiven Zuwendung durch den Therapeuten (wenn es einen gibt, d. h. wenn man keine Selbstmedikation betreibt). Oder einfach aus der Hoffnung, dass die Erleichterung bald eintreten wird und dem guten Gefühl, dass man etwas für seine Gesundung und seine Symptome tut. Das ist ein tatsächlicher, aber kein spezifischer psychologischer Effekt davon, sich einer Behandlung zu unterziehen und Schritten in die Richtung, die Situation kontrollieren zu können.

Ärgerlich für alle, die wir wissenschaftsbasierte Medizin verbreiten, ist, dass letzterer Faktor so behandelt wird, als sei dies der gesamte Placeboeffekt oder zumindest dessen größter Anteil. Die Nachweislage jedoch legt nahe, dass das ein sehr kleiner Anteil des Effektes ist.

Eine neue Studie über Asthma zum Beispiel zeigt (siehe Grafik rechts und Erläuterungen unter (1) ), dass der Placeboeffekt im Hinblick auf die Schwere des Asthmas bei objektiven Messungen im Wesentlichen gleich null ist. Es gab einen deutlichen Effekt bei den subjektiven Bewertungen. Testpersonen berichteten, dass sie sich besser fühlten, sogar wenn die objektiven Messwerte zeigten, dass es ihnen nicht besser ging. Das klingt sehr nach Bestätigungsfehlschluss und anderen psychologischen Faktoren wie Rechtfertigung von Aufwand und Risiko (expense/risk justification) und Täuschung durch Optimismus.

Schlussfolgerung: Geschichten triumphieren oft über Statistiken

Placeboeffekte speisen sich weitestgehend aus Illusionen verschiedener gut bekannter psychologischer Faktoren und Irrtümer in Wahrnehmung, Erinnerung und Bewusstsein – Bestätigungsfehlschluss, Regression zur Mitte, post-hoc-Fehlschluss, Täuschung aus Zuversicht, Risikorechtfertigung, Beeinflussbarkeit, Erwartungsfehlschluss und dem Unvermögen, viele Variablen zu betrachten. Es gibt auch unterschiedliche und subjektive Effekte (abhängig von den Symptomen, die behandelt werden), die aus einer verbesserten Stimmung und Zukunftsaussicht resultieren.

Aus all diesem zu schließen, dass die Behandlung „gewirkt“ habe, wenn auf eine Behandlung anscheinend eine Besserung von Symptomen folgen, ist so, wie zu folgern, dass die psychischen Kräfte eines Hellsehers „gewirkt“ haben, wann immer seine zufällige Auswahl zutrifft. Deshalb sind anekdotische Erfahrungen so wertlos, um zu beurteilen, ob eine Behandlung gewirkt hat. Genauso wertlos wie die subjektive Erfahrung eines Opfers von Cold Reading dafür, herauszufinden, ob die Kräfte eines Hellsehers echt sind.

Jedoch ist sogar für viele Skeptiker Letzteres nachvollziehbarer als das Erstere. Es ist schwierig, das Gefühl zu erschüttern, dass die Behandlung irgendwie gewirkt haben müsse, wenn sich jemand besser fühlt.

Dieser „Bei mir hat es gewirkt-Fehlschluss“ wird uns wahrscheinlich immer erhalten bleiben. Geschichten sind überzeugend und unsere eigenen ganz besonders. Das ist einfach so, unser Gehirn arbeitet so. Wenn wir etwas essen und uns wird danach schlecht, werden wir diese Speise in Zukunft vermeiden. Wenn wir uns einer Behandlung unterziehen und uns hinterher besser fühlen, dann wird das Gefühl, dass die Behandlung dafür die Ursache war, verstärkt und schwerlich mit trockenen Daten zu entkräften sein.

Das trifft sogar auf Behandlungen zu, deren Wirksamkeit erwiesen sind. Wir können einfach in keinem Einzelfall wissen, ob eine Behandlung wirksam war oder nicht, weil wir nicht wissen können, was ohne diese Behandlung geschehen wäre. Wir können nur statische Aussagen machen die auf klinischen Daten beruhen.

(1) Die relativen Verbesserungen in den Gruppen einer doppeltverblindeten Akupunktur-Studie zur Indikation Asthma. Die Gruppe mit der Standardbehandlung (Albuterol) zeigt bei objektiver Befunderhebung deutliche Überlegenheit gegenüber den anderen Versuchsgruppen: medikamentöses Placebo, Scheinakupunktur und Nichtbehandlung.

Rational in Statistiken zu denken anstelle sich von Anekdoten leiten zu lassen, ist nicht Teil der menschlichen Komfortzone! ->hier mehr darüber lesen

Der Autor Dr. Steven Novella ist Arzt und Skeptiker in den USA und schreibt für den weltweit renommierten Medizinblog Science-Based Medicine als dessen Gründer.

Übersetzt aus dem Englischen vom INH. Der Originaltext findet sich unter: The „It worked for me“ Gambit.

(Grafik: Dr. Steven Novella)