Wirksamkeit und Wirtschaftlichkeit der Homöopathie – Teil 2

Diesen Beitrag teilen:

Harald Walach

Wir haben im ersten Teil dieser Serie die rechtliche Situation der Zulassung und Prüfung von Homöopathika im deutschen Arzneimittelrecht untersucht und kommen nun zum zweiten Teil:

Wirksamkeit der Homöopathie

Methodische Vorüberlegungen

Der Gesetzgeber, so sahen wir, geht von der klinischen Wirksamkeit der Homöopathie aus. Deswegen müssen einzelne Phase-3-Studien zur Wirksamkeit für klassisch-homöopathische Arzneimittel, also solche, die als Einzelarzneien verordnet werden, nicht vorgelegt werden. Nur indikationsbezogene Arzneien müssen solche Belege vorlegen und tun dies auch. Wie aber steht es mit der Wirksamkeit der Homöopathie im klassischen Sinne, also der Überlegenheit von Homöopathie gegenüber Placebo oder der vergleichbaren Wirksamkeit gegenüber Standardtherapien?

Bevor wir das diskutieren nochmals eine Erinnerung:

Phase-3-Studien, die die Wirksamkeit einer Substanz gegenüber Placebo oder einer Standardanwendung testen sind immer Studien, die eine Patientengruppe mit einer definierten Diagnose einschließen und dort eine Anwendung testen. Das ist relativ einfach. Alle Patienten erhalten das gleiche Medikament oder die gleiche Anwendung, verglichen mit einem Placebo oder einer Standardbehandlung. Die Zuteilung der Patienten auf die Gruppen erfolgt zufällig und idealerweise sind die Patienten und Behandler verblindet und wissen nicht, wer was erhält.

Dieses Studienmodell wurde nun auch auf die Homöopathie angewandt. Allerdings muss man dabei folgendes bedenken: Wenn man Patienten mit einer Diagnose in eine Studie einschließt, dann wird es selten nur ein Homöopathikum geben, das für alle Patienten indiziert ist. Man hat im Prinzip drei Möglichkeiten:

  1. Man verwendet keine eigentliche, individualisierte Homöopathie, bei der ja nach der besten Passung der Symptome ein Arzneimittel aus einer Fülle von mehr als 1.500 Arzneien auszuwählen wäre. Sondern man nimmt eines der auf dem Markt befindlichen oder zuzulassenden Komplexhomöopathika, bei denen eine Mischung aus möglicherweise in Frage kommenden Arzneien zu einer Arznei mit Indikation verwendet wird. Dann wird z.B. Arnica, Rhus toxicodendron, Ruta und Bellis perennis, meistens in eher niedrigen Potenzen, zu einer Fertigarznei gemischt und bei Patienten mit Zerrungen und Prellungen verwendet. Diese Verwendung kommt der konventionellen Art der Therapie nahe und ist meist für akute Fälle gedacht. Solche Studien gibt es eine ganze Reihe, z.B. 1.
  2. Man definiert eine oder mehrere, häufig bei einer Krankheit in Frage kommender Arzneien und deren Arzneimittelbild und schließt dann nur solche Patienten ein, die dieses Arzneimittelbild haben. Das war etwa bei der Fibromyalgie-Studie von Peter Fisher der Fall2, oder bei der Kopfschmerzstudie von Brigo, die von Whitmarsh wiederholt wurde3,4. Man kommt damit einer klassisch-homöopathischen Anwendung, also einer Individualisierung, relativ nahe, schließt aber zum einen relativ viele in Frage kommende Patienten und Arzneimittel aus und wird bei der Definition der Arzneien möglicherweise Symptome übersehen oder unscharf werden.
  3. Man erlaubt die volle Individualisierung, also so, wie sie in der klassisch-homöopathischen Praxis vorgenommen wird und damit alle Arzneien bei Patienten mit einer bestimmten Diagnose. Aber der Arzt muss verblindet werden und weiß also nicht, ob der Patient nun seine Verordnung erhalten hat oder Placebo. Da solche Studien meistens bei Patienten mit chronischen oder komplexeren Störungen durchgeführt werden, ist eine einzige Verordnung selten ausreichend. Der Arzt muss also entweder seine Verordnung wiederholen, oder das Arzneimittel wechseln, wenn die erste Verordnung nicht passend war. Diese Entscheidung muss er oder sie aufgrund der Berichterstattung des Patienten nach einigen Wochen treffen. Weil er aber nicht weiß, ob der Patient sein Arzneimittel erhalten hat oder Placebo, ist diese Entscheidung alles andere als trivial und bildet auch die normale klinische Realität nicht ab, weswegen sie allen Verordnern ein hohes Maß an Kenntnis und Sicherheit abverlangt und zu eigenen Problemen führt. 5

Natürlicherweise sind Studien des Typs c), also der voll individualisierten Homöopathie selten und wenn sie vorkommen meistens eher kurz. Eine Variante ist ein Studientyp, bei dem zunächst ohne Verblindung bei Patienten die richtige Arznei gesucht wird und dann in einem verblindeten Schema weitergemacht wird.6 Die meisten vorliegenden Studien fallen in die Kategorie a) – bewährte Indikation – oder b) – Definition einiger weniger Arzneien.

Diese Situation hat folgende Konsequenzen: Die klassische, individualisierte Homöopathie, so wie sie in der klinischen Praxis verwendet wird, ist bislang eher wenig, eher schlecht und eher nur in kurzzeitigen Studien untersucht. Sie wurde in Langzeitbeobachtungen untersucht, also in offenen Dokumentations- oder Beobachtungsstudien, und zeigt dort einen klinischen Effekt bei etwa 75% der Patienten.7 Anders ausgedrückt: Wer mit einem chronischen Problem zu einem homöopathischen Arzt geht, der individualisiert behandelt, hat eine relativ hohe Chance, nämlich in 3 von 4 Fällen, eine klinisch relevante Besserung zu erleben. Die Frage ist: Ist dieser klinische Erfolg die Folge der homöopathischen Arzneien, die Folge der therapeutischen Interaktion, die Folge eines gigantischen Placebo-Effektes oder einer Mischung aus diesen. Wahrscheinlich ist es eine Interaktion all dieser Effekte. Für den Patienten (und das Gesundheitssystem) ist es allerdings eigentlich völlig unerheblich, wie der Effekt zustande kommt, solange er zuverlässig, einigermaßen kostengünstig und ohne große Nebenwirkungen und Gefahren zustande kommt.

Insofern ist die Frage, ob homöopathische Arzneien nun von Placebo verschieden sind, eigentlich eine sehr spezielle, akademische, aber natürlich höchst interessante Frage. Wenn wir nun die Studienlage betrachten, muss uns dies klar sein. Denn verblindete klinische Studien untersuchen nur diese Frage, sonst nichts. Und im Fall der Homöopathie haben sie meist eine vereinfachte Form der Homöopathie untersucht, nämlich bewährte Indikationen (a) und verkürzte Individualisierung (b).

Meta-Analysen

Klassischerweise werden Fragen nach der generellen Wirksamkeit („efficacy“) wie gesagt in einzelnen verblindeten, placebo-kontrollierten Studien untersucht oder in Studien, die gegen einen klinischen Standard vergleichen. Da einzelne Studien aber immer auch anfällig für Fehler und zufällige Schwankungen sind, führt man Meta-Analysen durch. In solchen Meta-Analysen werden die Effekte der einzelnen Studien statistisch zusammengefasst, und durch die größere Zahl der Studien und damit natürlich auch der Patienten und Behandlungstypen wird eine robustere Schätzung des Effektes und seiner statistischen Absicherung möglich.

Solche Meta-Analysen gibt es für die Homöopathie eine ganze Reihe. Ich fasse in der Tabelle die wichtigsten zusammen. Das sind solche, die entweder neue und innovative Aspekte eingebracht haben oder aber in der Literatur einflussreich waren. Daneben gibt es eine Reihe von Teil-Analysen, oder Meta-Analysen von Teilbereichen, die ich ausklammere.

Autoren Anzahl Studien/
ausgewertet
Ergebnis
Linde et al. 1997 8 119/89 OR = 2.45/1.78*
Kommentar:Relativ robust; Effekt für methodisch bessere Studien geringer
Cucherat et al. 2000 9 118/17 p < 0.00036
Kommentar:Sehr konservative und technisch unzulängliche Zusammenfassung der Signifikanzen
Shang et al. 2005 10 110/8 Kein Effekt
Kommentar:Wenn man nur 8 Studien berücksichtigt kein Effekt, sonst schon
Lüdtke&Rutten 2008 11 110/21 OR = 0.76*
Kommentar:Re-Analyse der Daten von Shang und Sensitivitätsanalyse. 21 Studien mit der besten Qualität ergeben einen signifikanten Effekt. Wenn man die Studien der Größe nach ordnet (wie Shang), dann findet man ab 14 eingeschlossenen Studien immer einen signifikanten Effekt
Mathie et al. 2014 12 32/22 OR = 1.53 (1.98)*
Kommentar:Nur Studien mit individualisierter Homöopathie
*= signifikantes Ergebnis

Linde et al. 1997

Die erste dieser Analysen war die von Klaus Linde und Kollegen. Sie recherchierte alle damals vorhandenen placebo-kontrollierten Studien und fand immerhin 119, eine Zahl die schon damals sowohl Befürworter als auch Kritiker überraschte. Zusammengefasst ergibt sich eine signifikante Effektstärke mit einer Odds Ratio (OR) von 2.45, die auf 1.78 schrumpft, aber immer noch signifikant ist, wenn man nur die besten Studien nimmt.

Eine Odds Ratio ist eine Effektstärke, die das Verhältnis von therapeutischen Erfolgen und Misserfolgen in der Behandlungs- und Kontrollgruppe abbildet, also dichotome Maße zusammenfasst. Je nachdem, wie das Verhältnis gebildet wird, sind Werte über 1, wie hier, oder kleiner als 1, wie bei Lüdtke, Indikatoren für Erfolg. Hier bedeutet die OR = 2.45, dass Patienten in der Homöopathiegruppe 2.45 mal so häufig Erfolg hatten, oder 1.78 mal in den Studien, die höhere methodische Qualität aufwiesen. Beide Effektstärken waren signifikant. Allerdings zeigte sich eine lineare Abnahme des Effektes, je höher die methodische Güte der Studie war.

Verschiedene Validitätstypen

Dazu muss man folgendes wissen: die methodische Güte einer Studie ist kein eindeutiges Merkmal, wie die Farbe eines Autos. Es gibt zwar Kriterien, wie Verblindung, oder Randomisierung, etc. Diese bilden aber nur die sog. interne Validität ab, also die Sicherheit, mit der man sich auf die Schlussfolgerungen einer Studie verlassen kann. Wichtig ist aber auch die externe Validität, also die Anwendbarkeit, und die Modellvalidität, also die Sorgfalt, mit der eine Studie die zu untersuchende Therapie abgebildet hat. Interne und externe Validität sind eigentlich inkompatibel 13, d.h. man kann sie praktisch nicht in ein und der selben Studie optimieren sondern braucht dafür unterschiedliche Studientypen, und Modellvalidität ist sehr schwer zu fassen. Der Befund, den Klaus Linde und Kollegen dokumentieren, dass mit steigender interner Validität die Effekte kleiner werden ist ein wohlbekannter Effekt, der praktisch überall zu beobachten ist. Immerhin hatten auch noch die besten Studien eine signifikante Effektstärke. Diesen Befund haben zwar dann in der Folge verschiedene Autoren durch Sekundärpublikationen versucht zu relativieren. Das geht immer und wurde auch hier so gemacht, indem man eben Gründe sucht, um Studien nicht einzuschließen und dann eben nur die 5 oder 3 besten Studien nimmt. Dann verschwindet die Signifikanz der Effekte, weil sich die Variabilität vergrößert und die statistische Mächtigkeit abnimmt. Aber solche Strategien halte ich nicht für wissenschaftlich lauter, weswegen ich sie auch nicht weiter bespreche.

Cucherat et al. 2000

Die Analyse von Cucherat und Kollegen entstammte einem größeren Evaluationsprojekt und der Publikation ist anzumerken – und die Autoren machen auch keinen Hehl daraus, dass man versuchte mit allen Mitteln die verblüffende Signifikanz des Gesamtergebnisses zu reduzieren. Die Zusammenfassung selber ist vom Standpunkt der Meta-Analyse schwach, weil keine Effektstärken zusammengefasst wurden sondern eine extrem konservative Methode verwendet wurde, um die zusammengefasste Signifikanz zu dokumentieren. Das entsprach eigentlich schon damals nicht dem Stand der Kunst und tut es heute noch weniger. Die Autoren reduzierten den Gesamtpool an Studien auf die 17 besten und auch die kommen noch auf ein insgesamt signifikantes Ergebnis. Das schwindet erst dann, wenn man nur die 5 oder 3 allerbesten nimmt, aber dann hat man, wie schon oben besprochen, eben das Problem, dass man hohe Variabilität mit reduzierter statistischer Mächtigkeit paart. Das ist eine schlechte und technisch auch nicht empfohlene Methode, wenn man einmal die Literatur zur Meta-Analyse zur Kenntnis nimmt 14-17.

Shang et al 2005

Am häufigsten zitiert wird die Analyse von Shang und Kollegen, die aus dem schweizerischen Programm zur Evaluation der Komplementärmedizin (PEK) hervorgegangen ist. (Aus diesem Programm ist auch ein Health Technology Assessment Report zur Homöopathie entstanden, also ein pragmatischer Überblick. Dieser ist ebenfalls positiv ausgefallen.18) Shang und Kollegen fanden etwas weniger Studien als die Meta-Analysen vor ihnen. Das ist wohl das geringere Problem. Dann ordneten sie alle Studien nach Größe, die größten zuerst. Das hat eine gewisse Berechtigung, denn große Studien sind in aller Regel robuster in der Schätzung von Effekten als kleine, einfach weil bei ihnen die Schätzfehler statistisch gesehen geringer sind. Allerdings darf man folgendes nicht übersehen: Die Größe einer Studie, das hatten wir im vorigen Teil bereits gesehen, hängt auch davon ab, ob es für eine Krankheit bereits andere Therapien gibt, ob eine Therapie ganz neu ist, wie groß die zu erwartenden Effekte sind, etc. Bei Studien, die auf Pilotstudien aufbauen, die einen relativ großen Effekt gezeigt haben, wird sowohl aus ethischen als auch aus wirtschaftlichen Gesichtspunkten eine relativ kleine Studie ausreichen, den Effekt zu zeigen. Bei Studien, die einen eher kleinen Effekt antizipieren, wird die Studie größer geplant. Daher das Vorgehen, nur die größten Studien zu berücksichtigen, nur in Grenzen sinnvoll.

Der entscheidende, und häufig kritisierte Schritt der Autoren war nun aber, lediglich acht aller Studien in die formale Analyse einzuschließen. Dieses Vorgehen wurde nirgends begründet, war nicht apriori definiert und wurde auch anschließend nie begründet. Erst auf vielfältigen Druck und Kritik hin19,20 gaben die Autoren auf ihrer Webseite bekannt, welches die 8 Studien waren, die eingeschlossen wurden. Das ist aus meiner Sicht ein inakzeptables Vorgehen, und eigentlich verstößt es gegen die Praxis guter Meta-Analysen, weswegen sich der Kenner wundern muss, warum Lancet diese Arbeit überhaupt zur Publikation angenommen hat. Wenn man nur diese 8 Studien analysiert, ergibt sich eine nicht-signifikante Effektstärke. Außerdem haben Shang und Kollegen noch eine weitere methodische Besonderheit eingebaut: sie haben zu jeder Homöopathie-Studie zufällig eine konventionelle Vergleichsstudie gesucht. Wenn man das macht, dann sieht man, dass die Effektstärken der konventionellen Studien auf einen Punkt konvergieren, der von Null verschieden ist, die Effekte der Homöopathiestudien aber gegen Null gehen und also von Placebo nicht verschieden sind.

Allerdings haben Shang und Kollegen nie den Gesamteffekt aller Studien berichtet, außer dass sie in ihrer Publikation gesagt haben, er sei signifikant.

Lüdtke & Rutten (2008)

Dies haben Lüdtke und Rutten in einer Re-Analyse der Shang-Daten nachgeholt. Sie haben zunächst die Analyse von Shang wiederholt und kamen zum gleichen Ergebnis. In einer sog. Sensitivitätsanalyse haben sie dann überprüft unter welchen Bedingungen der Effekt auftaucht und verschwindet. Sensitivitätsanalysen sind eigentlich Standard in der Meta-Analyse, und man muss sich wundern, warum Shang und Kollegen diese nicht selber durchgeführt und publiziert haben (und warum die Gutachter von Lancet bzw. der Herausgeber das nicht eingefordert haben). Solche Analysen zeigen nämlich, wie robust die Ergebnisse gegenüber den Vorannahmen sind. Da jede Meta-Analyse immer auch Annahmen trifft, ist es wichtig zu überprüfen, welchen Einfluss diese Annahmen auf die Robustheit des Ergebnisses haben, in diesem Fall etwa die Annahme dass es sinnvoll und richtig ist, die Daten nach Studiengröße zu ordnen und nur 8 aufzunehmen. Lüdtke und Rutten haben nun eine Analyse gerechnet, in der sie sukzessive immer mehr Studien einschlossen. Man sieht dabei: die Zahl von 8 Studien bezeichnet einen Punkt, an dem eine kumulative Meta-Analyse in den nicht-signifikanten Bereich kommt, nimmt man mehr Studien hinzu, wird die Effektgröße wieder signifikant, dann wieder nicht. Ab 14 Studien und bis zum Schluss, also zum Einschluss aller Studien, wird man immer eine signifikante Effektgröße finden, die immer um die Größe von OR = 0.76 schwankt, aber dann eben immer signifikant ist. Diese Effektgröße bedeutet, dass der Effekt unter Placebo 24% schwächer ist als unter Verum.

Es ist wichtig sich noch einmal vor Augen zu halten: Die Effektgröße schätzt den klinischen Effekt einer Intervention gegenüber Kontrolle, in dem Fall Placebo. Die Signifikanzberechnung fragt, ob dieser Effekt eine Zufallsschwankung darstellt oder nicht. Sie hängt im Wesentlichen davon ab, ob die Effektgrößen sehr stark schwanken, also davon, wie hoch die Variabilität der individuellen Effektgrößen in allen Studien ist, und davon, wie viele Studien zusammengefasst werden. Ist die Variabilität gering, dann können auch schon wenige, konvergierende Studien einen signifikanten Effekt zeigen. Umgekehrt müssen bei einer hohen Variabilität wie hier, viele Studien zusammengefasst werden, um einen signifikanten Effekt zu zeigen. Die Re-Analyse von Lüdtke und Rutten zeigt: es müssen 14 Studien sein, um einen robusten Effekt schätzen zu können, der immer signifikant ist. Das ist eigentlich bei insgesamt 110 Studien gar nicht übel und lässt im Nachhinein die Frage als berechtigt erscheinen, warum Shang und Kollegen sich auf 8 Studien kapriziert haben. Weil sie dann einen nicht-signifikanten Effekt belegen konnten? Weil die 8. Studie meine eigene war, die insgesamt die größte negative Effektstärke in der ganzen Literatur zeigt?21 Weil sie die Studiengröße von 100 als Grenzwert sahen? Warum aber dann meine Studie als 8. einschließen, die 98 Teilnehmer hatte und nicht 100? Wäre diese weggelassen worden und nur 7 Studien eingeschlossen worden, dann wäre der Effekt wieder signifikant geworden. Man sieht: die Übung von Lüdtke und Rutten war keineswegs umsonst. Denn sie zeigt, wie anfällig die Analyse von Shang und Kollegen gegenüber Entscheidungen ist. Und wenn Entscheidungen, wie hier, nicht rational begründet wurden, regt sich der Verdacht, dass Vormeinungen eine größere Rolle spielten als die leidenschaftslose Suche nach dem richtigen Vorgehen.

Außerdem zeigte die Analyse von Lüdtke und Rutten: den größten Einfluss auf die Signifikanz der Daten nimmt eine einzige negative Studie, die auch zu den größten überhaupt gehört, bei der Arnica zur Verhinderung eines Muskelkaters bei Marathonläufern verwendet wurde.22 Man kann sich zu Recht fragen, inwiefern eine solche Anwendung eine Aussagekraft für klinisch angewandte individualisierte Homöopathie hat. Schließt man diese Studie aus, dann ist der Effekt immer positiv, auch bei einem Datensatz von 7 Studien.

Mathie et al (2014)

Die Analyse von Mathie hatte explizit das Ziel, nur individualisierte, klassische oder individualisierte Homöopathie zu untersuchen. Sie fand einen signifikanten Effekt von OR = 1.53, der bei den methodisch besten Studien auf 1.98 anstieg. Ein Kranker, der in einer Homöopathiegruppe behandelt wird ist also um mehr als 50% besser dran als einer, der in einer Placebo-Gruppe behandelt wird. Nimmt man nur die besten Studien dann ist der Behandlungserfolg in der Homöopathiegruppe sogar fast doppelt so gut als in der Placebogruppe. Beide Effektschätzungen sind signifikant, also überzufällig von Null verschieden.

Robert Hahn, ein Schmerztherapeut aus Linköping in Schweden, wo damals ein heftiger Streit über anthroposophische und homöopathische Medizin  tobte, wollte sich einfach einmal informieren; er war weder Homöopath noch kannte er sich vorher in der Literatur aus. Er sichtete daher neugierig und interessiert die Literatur und stellte die Meta-Analysen, die ich oben besprochen habe, zusammen. 23 Er stellte erstaunt fest: Nur wenn man 90% bis 95% aller vorhandenen Studien ignoriert, kann man behaupten, die Homöopathie sei von Placebo nicht zu unterscheiden.

Ich persönlich stimme dem zu. Es ist eine merkwürdige Praxis, möglichst viele Studien aus der Effektberechnung auszuschließen, wie das Cucherat, Shang und andere immer wieder gemacht haben. Schließlich versucht man in jeder Meta-Analyse und in jedem systematischen Literaturüberblick alle Daten zu erfassen, sogar solche, die in obskuren Zeitschriften publiziert sind, die gar nicht publiziert sind oder die nur als Abstract oder Buchkapitel erschienen sind. Und im Normalfall ist eine Meta-Analyse umso gründlicher und zuverlässiger, je mehr Daten sie berücksichtigt. Gerade hier, bei der Homöopathie, wollen manche diese Praxis umkehren. Das Argument dafür ist: Nur die größten und zuverlässigsten Einzelschätzungen sind hilfreich. Dann kann man auch gleich wieder zu der Idee zurückkehren, mit einer einzigen, großen Studie alles entscheiden zu wollen. Weil genau das gar nicht geht, hat man ja die Idee der Meta-Analyse entwickelt. Aber genau für die Homöopathie soll das nun anders sein? Merkwürdige Logik.

(Selbst-)Kritische Gedanken

Ich persönlich meine, man kann das Motiv der kritischen Forscher und Literaturübersichten verstehen. Allerdings explizieren sie das Motiv nicht ganz genau. Hier ist eine kurze Rekonstruktion: Die gewöhnliche, sog. frequentistische Statistik, geht davon aus, dass wir nichts, aber auch gar nichts über den zu erforschenden Effekt wissen, dass also die Ausgangswahrscheinlichkeit 50:50 ist, dass wir einen Effekt finden. Das ist immer dann der Fall, wenn wir z.B. eine neue Substanz testen, von der wir nichts wissen. Allerdings haben wir dann, wenn wir z.B. erste Daten aus Tierversuchen und aus theoretischen Überlegungen haben bereits ein gewisses Vorwissen und unsere Ausgangswahrscheinlichkeit verschiebt sich. Streng genommen ist dann die klassische Statistik gar nicht mehr anwendbar und man müsste eine sog. Bayes’sche Statistik verwenden. Diese geht auf den irischen Pastor Bayes zurück, der klar erkannt hat, dass unsere Entscheidungen abhängig davon sind, welche Ausgangswahrscheinlichkeiten („prior odds“ oder „priors“) wir haben. Denn davon hängt ab, wie wir ein empirisches Ergebnis bewerten und welche Endwahrscheinlichkeit („posterior odds“ oder „posteriors“) entsteht. Das Gefüge unserer wissenschaftlichen Entscheidung enthält also nicht nur das nackte Ergebnis einer Studie, sondern das Ergebnis, bewertet auf dem Hintergrund unseres Vorwissens.

Diese Situation führt nun dazu dass Menschen, die implizit oder explizit skeptisch sind, der Homöopathie eher eine sehr niedrige Ausgangswahrscheinlichkeit – „prior odds“ – zubilligen. Wenn diese sehr niedrig ist, dann muss ein empirisches Ergebnis sehr mächtig sein, um diese zu verschieben und einen Skeptiker zu überzeugen. Genauer gesagt: das geht praktisch nicht. Denn so stark sind empirische Ergebnisse nie. Die Forschung ist fehlerbehaftet, die Studien sind nicht mächtig genug, oder man müsste extrem viele machen, was unrealistisch ist. Und vor allem: solange keine brauchbare Theorie der homöopathischen Wirkung existiert wird auch das stärkste empirische Ergebnis die theoretische Ausgangsskepsis nicht verändern können.

Wer will, kann diese Situation an einem Bayes-Rechner im Internet nachvollziehen; im Menu „interpret p-values“ wählen).

Man gibt hier bei „alpha“ den empirischen p-Wert ein, z.B. das empirische Ergebnis der Meta-Analyse von Cucherat 0.000038. Man wählt eine vernünftige statistische Mächtigkeit oder Power (siehe https://harald-walach.de/methodenlehre-fuer-anfaenger/13-power-analyse-die-magie-der-statistik-oder-der-unterschied-zwischen-signifikanz-und-relevanz/), also z.B. 90%. Dann kann man bei „prior probability“ die Ausgangswahrscheinlichkeit eingeben, z.B. 50% für jemanden, der eine ausgewogene Ausgangssituation hat, oder 0.1% für einen starken Zweifler, 0.0001% für einen extremen Skeptiker, oder 80% für einen der Homöopathie sehr Gewogenen. Dann erhält man die Endwahrscheinlichkeit (posterior odds) und sieht, wie stark die Ausgangswahrscheinlichkeit die Endwahrscheinlichkeit prägt. Für einen ausgewogenen Menschen, der keine Vormeinung hat, reicht eine starke Studie, um seine Endwahrscheinlichkeit fast in Sicherheit zu verwandeln und bei einem positiv der Homöopathie Zugeneigten sowieso. Aber bei einem Skeptiker wird eine solche Studie gar keine großartige Verschiebung der Position bewirken.

Aus diesem Grund sind diese Wahrscheinlichkeiten aus Studien eher theoretische Größen, die praktisch, je nach Ausgangssituation, ganz unterschiedlich bewertet werden. Weil die Menschen sich dieser Situation meist nicht bewusst sind, werden dann alle möglichen anderen Gründe aus dem Hut gezaubert. Ehrlicher wäre es zu sagen: „Ich glaube einfach nicht, dass Homöopathie funktionieren kann. Daher wird mich auch ein noch so starkes empirisches Ergebnis nie und nimmer überzeugen.“ Oder wie es Daniel Dennett einmal angesichts der Diskussion um die Parapsychologie, für die ähnliche Verhältnisse gelten, gesagt hat: „Wenn diese Daten stimmen würden, dann würde ich mich umbringen.“ 24, p. 269 Daher wird die Diskussion um die Wirksamkeit der Homöopathie nie und nimmer nur eine simple empirische Frage sein. Wäre sie das, wäre die Frage schon entschieden: die meisten Meta-Analysen, vor allem der komplette Datensatz der klinischen Homöopathiestudien, egal wie man sie analysiert, zeigen, dass Homöopathie von Placebo verschieden ist und also im herkömmlichen Sinne wirksam ist. Aber eben nur, wenn man mit einer offenen Sicht oder einer Ausgangswahrscheinlichkeit von 0,5 an die Daten herantritt.

Ein weiterer kritischer Gedanke:

Ein zentrales Anliegen von Forschung ist es, Fehler und Schwankungen zu korrigieren. Die Physiker zum Beispiel akzeptieren Daten normalerweise erst dann, wenn ein Effekt mit einer Wahrscheinlichkeit gesichert wurde, der 5 Standardabweichungen der Standardnormalverteilung entspricht, das berühmte „5 Sigma“. Das entspricht einer Wahrscheinlichkeit von p = 10-6, oder einer Kommazahl mit 6 Nullen hinter dem Komma. So stark sind die Effekte der homöopathischen Meta-Analysen bei weitem nicht. Allerdings gilt das für die gesamte Medizin, wie Horton, der Herausgeber von Lancet vor Kurzem einmal angemahnt hat 25. Der Unterschied ist, dass es für die Medizin insgesamt einen stillschweigenden Konsens gibt (und eine moderat robuste Datenbasis, würde ich sagen), dass die Ausrichtung, die theoretische Fundierung und daher die Bewertung der Ergebnisse solide sind. Manche bezweifeln das, vor allem angesichts der massiven Replikationskrise nicht nur in der Medizin und der Psychologie 26, sondern auch anderswo. 27,28 Aber insgesamt sind die Kritiker doch eher geneigt, den konventionellen Daten Glauben zu schenken, auch wenn sie verglichen mit denen der Homöopathie so verschieden und so besser oft nicht sind. Das hat aber wie gesagt eher theoretische und ideologische Gründe.

Allerdings muss man eines zugestehen: Es ist in der Homöopathie sehr schwierig replizierbare Befunde innerhalb eines Modells zu erzeugen, also z.B. 5 oder 10 Studien zum gleichen Krankheitsbild und mit der gleichen Methode zu machen, und dabei die ursprünglichen Effekte zu reproduzieren. Wo das versucht wurde, z.B. beim erfolgreichen Modell von Brigo mit Homöopathie bei Migräne – die wohl erfolgreichste Studie in der gesamten Homöopathie-Literatur 3 – da scheiterten die Nachfolgeversuche bzw. zeigten wesentlich schwächere Effekte 4,21,29. Man sieht das auch teilweise bei den erfolgversprechenden Versuchen von David Reilly, die wir besprochen haben (https://www.homöopathie-forschung.info/klassische-studien_heuschnupfen/). Zwar sind Einzelstudien sehr erfolgreich gewesen und die Meta-Analyse über alle Studien ist signifikant 30. Es gibt aber auch spektakulär gescheiterte Replikationen 31. Ob das anders und deutlicher ist als in der konventionellen Medizin weiß ich nicht; das mögen andere beurteilen. Auf jeden Fall zeigt diese Situation: wir haben die Homöopathie noch nicht gut genug verstanden. Ich persönlich bin der Meinung, dass sich dahinter eine völlig andere Kategorie von Effekten zeigt, die wir momentan nicht in unser wissenschaftliches Weltbild einordnen können.32-34 Daher ist auch der Kampf so heiß. Aber dies ist eine sehr spezialisierte Diskussion, die weit über die Frage der Wirksamkeit hinaus geht; daher will ich sie hier beschließen und vielleicht ein andermal wieder aufgreifen.

Fassen wir zusammen:

Die mehrfachen Meta-Analysen zur Homöopathie kommen in der Mehrzahl zu dem Schluss, dass Homöopathie von Placebo unterscheidbar ist. Man kann dieses Resultat ignorieren oder man kann es auch negieren, wenn man 90% bis 95% aller Daten ausschließt. Dann kann man auch getrost die Behauptung aufstellen, Homöopathie sei Placebo. Ob das lauter, sachgerecht und sinnvoll ist? Ich finde, das ist eine Verzerrung der Sachlage. Wenn man, wie bei Meta-Analysen üblich, alle Daten zusammenfasst, zeigt sich klar, dass Homöopathie von Placebo signifikant unterscheidbar ist. Für einen extremen Kritiker und Skeptiker, der mit einer starken negativen Vormeinung zur Plausibilität der Homöopathie die Daten beurteilt, wird die statistische Signifikanz nicht ausreichen, um seine Skepsis zu überwinden. Aber wenn man unvoreingenommen an die Daten herantritt muss man eingestehen: Homöopathie ist Placebo überlegen, jedenfalls über alle Studien hinweg. Das gilt für die individualisierte, klassische Homöopathie, aber auch für die vielen Studien, die die Homöopathie auf einfachere Weise modelliert haben. Daher ist es auch gerechtfertigt, um auf unsere Ausgangsfrage zurückzukommen, wenn der Gesetzgeber im Arzneimittelgesetz homöopathischen Einzelmitteln den je individuellen Nachweis der Wirksamkeit erlässt.

Referenzen

  1. Wiesenauer M, Gaus W. Wirksamkeitsnachweis eines Homöopathikums bei chronischer Polyarthritis. Eine randomisierte Doppelblindstudie bei niedergelassenen Ärzten. Aktuelle Rheumathologie 1991; 16: 1-9.
  2. Fisher P, Greenwood A, Huskisson EC, Turner P, Belon P. Effect of homoeopathic treatment on fibrositis (primary fibromyalgia). British Medical Journal 1989; 299: 365-6.
  3. Brigo B, Serpelloni G. Le traitement homéopathique de la migraine: une étude de 60 cas, controlée en double aveugle (remède homéopathique vs. placebo). Journal of the Liga Medicorum Homoeopatica Internationalis 1987; 1: 18-25.
  4. Whitmarsh TE, Coleston-Shields DM, Steiner TJ. Double-blind randomized placeo-controlled study of homoeopathic prophylaxis of migraine. Cephalalgia 1997; 17: 600-4.
  5. Walach H. Verblindung in klinischen Homöopathie-Studien? In: Hornung J, ed. Forschungsmethoden in der Komplementärmedizin Über die Notwendigkeit einer methodologischen Erneuerung. Stuttgart: Schattauer; 1996: 1-16.
  6. Frei H, Everts R, von Ammon K, et al. Homeopathic treatment of children with attention deficit disorder: a randomised, double-blind, placebo controlled crossover trial. European Journal of Pediatrics 2005; 164: 758-67.
  7. Witt CM, Lüdtke R, Baur R, Willich SN. Homeopathic medical practice: Long term results of a cohort study with 3981 patients. BMC Public Health 2005; 5: 115.
  8. Linde K, Clausius N, Ramirez G, et al. Are the clinical effects of homoeopathy placebo effects? A meta-analysis of placebo controlled trials. Lancet 1997; 350: 834-43.
  9. Cucherat M, Haugh MC, Gooch M, Boissel JP, HMRAG Group. Evidence of clinical efficacy of homeopathy. A meta-analysis of clinical trials. European Journal of Clinical Pharmacology 2000; 56: 27-33.
  10. Shang A, Huwiler-Münteler K, Nartey L, et al. Are the clinical effects of homeopathy placebo effects? Comparative study of placebo-controlled trials of homoeopathy and allopathy. Lancet 2005; 366: 726-32.
  11. Lüdtke R, Rutten ALB. The conclusions on the effectiveness of homeopathy highly depend on the set of analyzed trials. Journal of Clinical Epidemiology 2008; 61: 1197-204.
  12. Mathie RT, Lloyd SM, Legg LA, et al. Randomised placebo-controlled trials of individualised homoeopathic treatment: sytematic review and meta-analysis. Systematic Reviews 2014; 3(142).
  13. Walach H, Loef M. Using a matrix-analytical approach to synthesizing evidence solved incompatibility problem in the hierarchy of evidence. Journal of Clinical Epidemiology 2015; 68: 1251-60.
  14. Hunter JE, Schmidt FL. Methods for Meta-Analysis: Correcting Error and Bias in Research. Newbury Park: Sage; 1990.
  15. Hunter JE, Schmidt FL, Jackson GB. Meta-Analysis. Cumulating Research Findings Across Studies. Beverly Hills: Sage; 1982.
  16. Rosenthal R, DiMatteo MR. Meta-Analysis: Recent Developments in Quantitative Methods for Literature Reviews. Annual Review of Psychology 2001; 52(1): 59-82.
  17. Rosenthal R. Meta-Analytic Procedures for Social Research. Newbury Park: Sage; 1991.
  18. Bornhöft G, Matthiessen PF, editors. Homeopathy in Healthcare: Effectiveness, Appropriateness, Safety, Costs. Heidelberg: Springer; 2012.
  19. Walach H, Jonas W, Lewith G. Letter to the Editor: Are the clinical effects of homoeopathy placebo effects? Comparative study of placebo-controlled trials of homoeopathy and allopathy. Lancet 2005; 366: 2081.
  20. Fisher P, Bell IR, Belon P, et al. Letter to the Editor: Are the clinical effects of homoeopathy placebo effects? Lancet 2005; 366: 2082.
  21. Walach H, Gaus W, Haeusler W, et al. Classical homoeopathic treatment of chronic headaches. A double-blind, randomized, placebo-controlled study. Cephalalgia 1997; 17: 119-26.
  22. Vickers AJ, Fisher P, Smith C, Wyllie SE, Rees R. Homoeopathic Arnica 30X is ineffective for muscle soreness after long distance running: A randomized, double-blind, placebo-controlled trial. The Clinical Journal of Pain 1998; 14: 227-31.
  23. Hahn RG. Homeopathy: Meta-Analyses of pooled clinical data. Forschende Komplementärmedizin 2013; 20: 376-81.
  24. Bierman DJ. On the nature of anomalous phenomena: Another reality between the world of subjective consciousness and the objective world of physics? In: Van Loocke P, ed. The Physical Nature of Consciousness. New York: Benjamins; 2001: 269–92.
  25. Horton R. Offline: What is medicine’s 5 sigma? Lancet 2015; 385: 1380.
  26. Open Science Collaboration. Estimating the reproducibility of psychological science. Science 2015; 349(6251): aac4716.
  27. Munafò MR, Nosek BA, Bishop DVM, et al. A manifesto for reproducible science. 2017; 1: 0021.
  28. Ioannidis JPA. Why most published research findings are false. PLoS Medicine 2005; 2(8): e124.
  29. Straumsheim P, Borchgrevink C, Mowinkel P, Kierulf H, Hafslund O. Homoepathic treatment of migraine: A double blind, placebo controlled trial of 68 patients. British Homeopathic Journal 2000; 89: 4-7.
  30. Taylor MA, Reilly D, Llewellyn-Jones RH, McSharry C, Aitchison TC. Randomised controlled trial of homoeopathy versus placebo in perennial allergic rhinitis with overview of four trial series. British Medical Journal 2000; 321: 471-6.
  31. Lewith GT, Watkins AD, Hyland ME, et al. Use of ultramolecular potencies of allergen to treat asthmatic people allergic to house dust mite: double blind randomised controlled clinical trial. British Medical Journal 2002; 324: 520-3.
  32. Walach H. Magic of signs: a non-local interpretation of homeopathy. British Homeopathic Journal 2000; 89: 127-40.
  33. Walach H. Entanglement model of homeopathy as an example of generalizsed entanglement predicted by Weak Quantum Theory. Forschende Komplementärmedizin und Klassische Naturheilkunde 2003; 10: 192-200.
  34. Lucadou Wv, Römer H, Walach H. Synchronistic Phenomena as Entanglement Correlations in Generalized Quantum Theory. Journal of Consciousness Studies 2007; 14(4): 50-74.

Diesen Beitrag teilen:

Warum die Homöopathie kein empirisches Problem ist

Diesen Beitrag teilen:

Harald Walach

Die Debatte um die Homöopathie wird ja immer um die Frage geführt: Zeigen wissenschaftliche Studien, dass die Homöopathie Placebo ist oder nicht? Dann kommen die einen und sagen: es gibt genug Studien, auch gute, die zeigen, dass Homöopathie von Placebo zu unterscheiden ist; u.a. auch ich in meinem letzten Blog-Blogbeitrag (www.homöopathie-forschung.info/EASAC). Und die Gegenseite sagt: es gibt keine Studien, die das beweisen (fast alle Kritiker und der wissenschaftliche Mainstream). Ich habe vor Zeiten schon (http://harald-walach.de/methodenlehre-fuer-anfaenger/vom-verhaeltnis-zwischen-empirie-und-theorie-1/) darauf hingewiesen, dass empirische Daten nie naiv interpretiert werden, sondern immer auf dem Hintergrund der vorhandenen Welterfahrung, eigener und bekannter Daten und Theorien, kurzum auf dem Hintergrund von Ausgangswahrscheinlichkeiten, mit denen man bestimmte Dinge erwartet oder nicht erwartet. Die Ausgangswahrscheinlichkeit, zum Beispiel, dass ein rosarotes Einhorn vor meiner Tür steht, wenn ich den Postboten erwarte, ist praktisch gleich Null. Deswegen werde ich auch nicht glauben, dass ein rosarotes Einhorn dort steht, wenn es läutet, ich in der Gegensprechanlage nach dem Begehr frage und zur Antwort bekommen „Guten Morgen, hier ist heute zur Abwechslung das rosarote Einhorn“. Eher denke ich, der Postbote hat sich im Kalender vertan und kommt mit Faschingsverkleidung, oder irgend so was.

Die Bedeutung der Ausgangswahrscheinlichkeiten und Pfarrer Bayes

So ähnlich ist es mit der Homöopathie auch. Je nachdem, welche Hintergrundtheorie der Welt wir haben, bewerten wir Informationen über die Homöopathie unterschiedlich. Wenn wir ein festgezimmertes Gebäude über die Welt haben, in dem nur materielle Wirkungen vorkommen und nur Moleküle etwas im Körper bewegen können, und auch geistige Wirkungen, z.B. unseres Willens, nur über materielle Prozesse, etwa Neuronenentladungen, verstehbar sind, dann wird uns die Homöopathie so unmöglich vorkommen, dass wir ein empirisches Ergebnis mit äußerster Sicherheit und großer statistischer Signifikanz oder Unwahrscheinlichkeit, und davon gleich mehrere brauchen, bevor wir bereit sind an unserem Glauben zu rütteln. Umgekehrt wird einem Arzt, der schon viele Heilungen gesehen hat oder einer Mutter, die Wirkungen an ihren Kindern kennt ein bisschen Empirie reichen, um zu der Ansicht zu gelangen, Homöopathie sei wissenschaftlich bewiesen.

Der irische Pfarrer Thomas Bayes (1702-1761) https://de.wikipedia.org/wiki/Thomas_Bayes hat diesen Sachverhalt seinerzeit formalisiert. Etwas eingedeutscht lautet seine Einsicht: Wir beurteilen empirische Ergebnisse immer auf dem Hintergrund dessen was wir erwarten, den sogenannten Bayesschen „prior probabilities“, was man mit Ausgangswahrscheinlichkeit wiedergeben kann. Je nachdem, wie hoch diese sind, genügen wenige empirische Ergebnisse, um diese in virtuelle Sicherheit zu überführen oder benötigen wir sehr viele, um sie überhaupt zu verändern. Genau diese Situation liegt bei der Homöopathie vor. Man kann sich das Ganze mit einem sog. Bayes-Rechner verdeutlichen, der die Bayesschen Argumente statistisch formalisiert berechnet (z.B. Graphpad: https://www.graphpad.com/quickcalcs/interpretPValue1/; man muss die Option „interpret p-value“ verwenden).

Eine Bayes-Simulation unterschiedlicher Ausgangswahrscheinlichkeiten zur Möglichkeit homöopathischer Wirkung

Ich habe in der nachstehenden Tabelle unterschiedliche Ausgangswahrscheinlichkeiten simuliert. Den Skeptiker (Ausgangswahrscheinlichkeit 0.001%), den Neutralen (Ausgangswahrscheinlichkeit 50%; so wie eigentlich Wissenschaft operieren sollte), den Gläubigen (Ausgangswahrscheinlichkeit 95%) und verschiedene Ergebnisse. Die statistische Mächtigkeit (Power) habe ich hoch gesetzt (also 95% oder alpha = beta; Fehler erster Art = Fehler zweiter Art; eine durchaus übliche Konvention in klinischen Studien; wer mehr wissen will, muss in meinem Methodenblog nachlesen oder auf Wikipedia).

 

Tabelle: Ergebnis einer Bayes-Simulation: Welchen Einfluss hat das Ergebnis einer einzigen hochsignifikanten klinischen Studie (p = 0.001) auf die Veränderung der Ausgangswahrscheinlichkeit eines Skeptikers (prior = 0.001% Chance, dass Homöopathie wirken kann), eines Neutralen (prior = 50% Chance) und eines Gläubigen (95% Chance)

Ausgangswahrscheinlichkeit,
dass Homöopathie wirken
kann (prior probability)
Empirisches Ergebnis einer
Studie: Signifikanzniveau
Posteriore Wahrscheinlichkeit,
dass Homöopathie wirkt
Skeptiker 0.001 % 0.001 0.0094
Neutraler 50 % 0.001 0.9989
Gläubiger 95 % 0.001 0.9999

 

Wir sehen: das Ergebnis ein und desselben klinischen Experimentes hat sehr unterschiedliche Auswirkungen. Beim Skeptiker verändert sich dessen skeptische Haltung nur mild auf 0.0094 oder  9.4 Promille, dass Homöopathie wirklich funktionieren kann. Beim Neutralen verändert eine sehr gute Studie mit sehr gutem Resultat die anfangs neutrale Haltung (50:50) in ziemliche Sicherheit (0.9989) und beim Gläubigen sowieso. Umgekehrt könnte man nun fragen: Wie viele Studien braucht es denn um Skeptiker zu überzeugen? Wenn man die oben angegebenen Parameter verwendet, dann müssten eigentlich bei einem rationalen Skeptiker, der dem Theorem von Pastor Bayes folgt, vier Studien dieser Art genügen, um die Skepsis in Sicherheit zu überführen. Da aber vermutlich meine oben angenommene Zahl (0.001% Ausgangswahrscheinlichkeit) viel zu hoch ist, und nicht alle Studien so starke Ergebnisse aufweisen, dürften es mit Sicherheit mehr Studien sein, die nötig sind.

Empirie alleine reicht nicht

Da wir Menschen aber nur begrenzt rational denken und handeln, dürfte die Frage, ob Empirie ausreichend ist, eher akademischer Natur sein. Denn wir Menschen sind nicht nur sehr stark auf unsere Vormeinungen angewiesen und lassen sie ungern ziehen und uns von der Empirie bekehren. Wir sind auch sehr eng emotional mit unseren Theorien von der Art, wie die Welt funktioniert verbunden. Daher ist die Frage, ob Homöopathie als wissenschaftlich gelten kann bzw. ab wann sie wissenschaftlich akzeptiert ist, keine empirische, oder nur teilweise eine empirische Frage. Denn die nötigen vier bis sechs klinischen Studien, um den oben simulierten Skeptiker zu bekehren, gibt es im Ensemble der etwa 120 klinischen Studien auf jeden Fall, wie der vorherige Blog-Beitrag gezeigt hat (www.homöopathie-forschung.info/EASAC). Wenn man allerdings verlangt, was Skeptiker in der Regel tun, dass sie alle in ein und derselben Diagnosekategorie vorliegen müssen, und das möglicherweise in jeder, die von der Homöopathie so behandelt wird, dann wird es in der Tat dünn. Nur, auch das habe ich letztes Mal gezeigt, ist diese Frage keine Frage, die der Homöopathie angemessen ist.

Aus dem Grund wird die Frage, ob Homöopathie wissenschaftlich akzeptiert wird bzw. akzeptabel ist, nur zum kleineren Teil von empirischen Argumenten geklärt werden können. Vielmehr werden wir eine Debatte darüber benötigen, ob, und gegebenenfalls welche, theoretische Modelle vorhanden sind, die die Homöopathie verstehbar machen. Denn das verändert die Ausgangswahrscheinlichkeiten unter denen die je gleichen empirischen Ergebnisse ganz anders bewertet werden. In einem der folgenden Blogs werden wir diesen Fragen nachgehen. Aber vielleicht wäre es ja schon eine Lösung Zweifel über die Theoriemöglichkeit für eine rationale Theorie der Homöopathie zu suspendieren und also dem Modell eines unvoreingenommenen Betrachters zu folgen. Dann würde der Wissensbestand allemal ausreichen, um die Wirksamkeit der Homöopathie als Beleg zu verwenden. Nur muss einem klar sein: das ist noch kein wissenschaftliches Faktum. Denn ein wissenschaftliches Faktum entsteht erst, wenn die Gemeinschaft der Wissenschaftler in einem öffentlichen Diskurs eine Situation als belegt akzeptiert hat. Und dazu gehört der momentane empirische Stand des Wissens zusammen mit einer denkbaren, akzeptablen und vermittelbaren Theorie und ein Konsens darüber. Und daher sind wir noch weit davon entfernt Homöopathie als wissenschaftlich belegt bezeichnen zu können. Genauer gesagt, das momentane Faktum ist eher: Homöopathie ist nicht belegt. Nicht, weil der Datenbestand so wäre, sondern weil die Diskurssituation so ist. Eine wissenschaftliche Tatsache ist die Übereinkunft, mit dem Denken aufzuhören. So ähnlich hat es Ludwik Fleck einmal ausgedrückt [1].

 

[1] Fleck, L. (1980). Entstehung und Entwicklung einer wissenschaftlichen Tatsache. Einführung in die Lehre vom Denkstil und Denkkollektiv. Mit einer Einleitung herausg. v. L. Schäfer und T. Schnelle. Frankfurt: Suhrkamp. (Original erschienen 1935).

 

 

Diesen Beitrag teilen: