Harald Walach
Wir haben im ersten Teil dieser Serie die rechtliche Situation der Zulassung und Prüfung von Homöopathika im deutschen Arzneimittelrecht untersucht und kommen nun zum zweiten Teil:
Wirksamkeit der Homöopathie
Methodische Vorüberlegungen
Der Gesetzgeber, so sahen
wir, geht von der klinischen Wirksamkeit der Homöopathie aus. Deswegen müssen
einzelne Phase-3-Studien zur Wirksamkeit für klassisch-homöopathische
Arzneimittel, also solche, die als Einzelarzneien verordnet werden, nicht
vorgelegt werden. Nur indikationsbezogene Arzneien müssen solche Belege
vorlegen und tun dies auch. Wie aber steht es mit der Wirksamkeit der
Homöopathie im klassischen Sinne, also der Überlegenheit von Homöopathie
gegenüber Placebo oder der vergleichbaren Wirksamkeit gegenüber
Standardtherapien?
Bevor wir das diskutieren
nochmals eine Erinnerung:
Phase-3-Studien, die die
Wirksamkeit einer Substanz gegenüber Placebo oder einer Standardanwendung
testen sind immer Studien, die eine Patientengruppe mit einer definierten
Diagnose einschließen und dort eine
Anwendung testen. Das ist relativ einfach. Alle Patienten erhalten das gleiche
Medikament oder die gleiche Anwendung, verglichen mit einem Placebo oder einer
Standardbehandlung. Die Zuteilung der Patienten auf die Gruppen erfolgt
zufällig und idealerweise sind die Patienten und Behandler verblindet und
wissen nicht, wer was erhält.
Dieses Studienmodell
wurde nun auch auf die Homöopathie angewandt. Allerdings muss man dabei
folgendes bedenken: Wenn man Patienten mit einer Diagnose in eine Studie
einschließt, dann wird es selten nur ein Homöopathikum geben, das für alle
Patienten indiziert ist. Man hat im Prinzip drei Möglichkeiten:
- Man verwendet
keine eigentliche, individualisierte Homöopathie, bei der ja nach der besten
Passung der Symptome ein Arzneimittel aus einer Fülle von mehr als 1.500
Arzneien auszuwählen wäre. Sondern man nimmt eines der auf dem Markt
befindlichen oder zuzulassenden Komplexhomöopathika, bei denen eine Mischung
aus möglicherweise in Frage kommenden Arzneien zu einer Arznei mit Indikation
verwendet wird. Dann wird z.B. Arnica, Rhus toxicodendron, Ruta und Bellis perennis,
meistens in eher niedrigen Potenzen, zu einer Fertigarznei gemischt und bei
Patienten mit Zerrungen und Prellungen verwendet. Diese Verwendung kommt der
konventionellen Art der Therapie nahe und ist meist für akute Fälle gedacht.
Solche Studien gibt es eine ganze Reihe, z.B. 1.
- Man definiert
eine oder mehrere, häufig bei einer Krankheit in Frage kommender Arzneien und
deren Arzneimittelbild und schließt dann nur solche Patienten ein, die dieses
Arzneimittelbild haben. Das war etwa bei der Fibromyalgie-Studie von Peter
Fisher der Fall2, oder bei der Kopfschmerzstudie von Brigo, die
von Whitmarsh wiederholt wurde3,4. Man kommt damit einer klassisch-homöopathischen
Anwendung, also einer Individualisierung, relativ nahe, schließt aber zum einen
relativ viele in Frage kommende Patienten und Arzneimittel aus und wird bei der
Definition der Arzneien möglicherweise Symptome übersehen oder unscharf werden.
- Man erlaubt
die volle Individualisierung, also so, wie sie in der klassisch-homöopathischen
Praxis vorgenommen wird und damit alle Arzneien bei Patienten mit einer
bestimmten Diagnose. Aber der Arzt muss verblindet werden und weiß also nicht,
ob der Patient nun seine Verordnung erhalten hat oder Placebo. Da solche
Studien meistens bei Patienten mit chronischen oder komplexeren Störungen
durchgeführt werden, ist eine einzige Verordnung selten ausreichend. Der Arzt
muss also entweder seine Verordnung wiederholen, oder das Arzneimittel
wechseln, wenn die erste Verordnung nicht passend war. Diese Entscheidung muss
er oder sie aufgrund der Berichterstattung des Patienten nach einigen Wochen
treffen. Weil er aber nicht weiß, ob der Patient sein Arzneimittel erhalten hat
oder Placebo, ist diese Entscheidung alles andere als trivial und bildet auch
die normale klinische Realität nicht ab, weswegen sie allen Verordnern ein
hohes Maß an Kenntnis und Sicherheit abverlangt und zu eigenen Problemen führt.
5
Natürlicherweise sind
Studien des Typs c), also der voll individualisierten Homöopathie selten und
wenn sie vorkommen meistens eher kurz. Eine Variante ist ein Studientyp, bei
dem zunächst ohne Verblindung bei Patienten die richtige Arznei gesucht wird und
dann in einem verblindeten Schema weitergemacht wird.6 Die meisten vorliegenden Studien fallen in die
Kategorie a) – bewährte Indikation – oder b) – Definition einiger weniger
Arzneien.
Diese Situation hat
folgende Konsequenzen: Die klassische, individualisierte Homöopathie, so wie
sie in der klinischen Praxis verwendet wird, ist bislang eher wenig, eher
schlecht und eher nur in kurzzeitigen Studien untersucht. Sie wurde in
Langzeitbeobachtungen untersucht, also in offenen Dokumentations- oder
Beobachtungsstudien, und zeigt dort einen klinischen Effekt bei etwa 75% der
Patienten.7 Anders ausgedrückt: Wer mit einem chronischen
Problem zu einem homöopathischen Arzt geht, der individualisiert behandelt, hat
eine relativ hohe Chance, nämlich in 3 von 4 Fällen, eine klinisch relevante
Besserung zu erleben. Die Frage ist: Ist dieser klinische Erfolg die Folge der
homöopathischen Arzneien, die Folge der therapeutischen Interaktion, die Folge
eines gigantischen Placebo-Effektes oder einer Mischung aus diesen. Wahrscheinlich
ist es eine Interaktion all dieser Effekte. Für den Patienten (und das
Gesundheitssystem) ist es allerdings eigentlich völlig unerheblich, wie der
Effekt zustande kommt, solange er zuverlässig, einigermaßen kostengünstig und
ohne große Nebenwirkungen und Gefahren zustande kommt.
Insofern ist die Frage,
ob homöopathische Arzneien nun von Placebo verschieden sind, eigentlich eine
sehr spezielle, akademische, aber natürlich höchst interessante Frage. Wenn wir
nun die Studienlage betrachten, muss uns dies klar sein. Denn verblindete
klinische Studien untersuchen nur diese Frage, sonst nichts. Und im Fall der
Homöopathie haben sie meist eine vereinfachte Form der Homöopathie untersucht,
nämlich bewährte Indikationen (a) und verkürzte Individualisierung (b).
Meta-Analysen
Klassischerweise werden
Fragen nach der generellen Wirksamkeit („efficacy“) wie gesagt in einzelnen
verblindeten, placebo-kontrollierten Studien untersucht oder in Studien, die
gegen einen klinischen Standard vergleichen. Da einzelne Studien aber immer
auch anfällig für Fehler und zufällige Schwankungen sind, führt man
Meta-Analysen durch. In solchen Meta-Analysen werden die Effekte der einzelnen
Studien statistisch zusammengefasst, und durch die größere Zahl der Studien und
damit natürlich auch der Patienten und Behandlungstypen wird eine robustere
Schätzung des Effektes und seiner statistischen Absicherung möglich.
Solche Meta-Analysen gibt es für die Homöopathie eine ganze Reihe. Ich fasse in der Tabelle die wichtigsten zusammen. Das sind solche, die entweder neue und innovative Aspekte eingebracht haben oder aber in der Literatur einflussreich waren. Daneben gibt es eine Reihe von Teil-Analysen, oder Meta-Analysen von Teilbereichen, die ich ausklammere.
Autoren
| Anzahl Studien/ ausgewertet |
Ergebnis
|
Linde et al. 1997 8
|
119/89
|
OR = 2.45/1.78*
|
Kommentar: | Relativ robust; Effekt für methodisch bessere Studien geringer |
Cucherat et al. 2000 9
|
118/17
|
p < 0.00036
|
Kommentar: | Sehr konservative und technisch unzulängliche Zusammenfassung der Signifikanzen |
Shang et al. 2005 10
|
110/8
|
Kein Effekt
|
Kommentar: | Wenn man nur 8 Studien berücksichtigt kein Effekt, sonst schon |
Lüdtke&Rutten 2008 11 | 110/21 |
OR = 0.76*
|
Kommentar: | Re-Analyse der Daten von Shang und Sensitivitätsanalyse. 21 Studien mit der besten Qualität ergeben einen signifikanten Effekt. Wenn man die Studien der Größe nach ordnet (wie Shang), dann findet man ab 14 eingeschlossenen Studien immer einen signifikanten Effekt |
Mathie et al. 2014 12
| 32/22 |
OR = 1.53 (1.98)*
|
Kommentar: | Nur Studien mit individualisierter Homöopathie |
* | = signifikantes Ergebnis |
Linde et al. 1997
Die erste dieser Analysen
war die von Klaus Linde und Kollegen. Sie recherchierte alle damals vorhandenen
placebo-kontrollierten Studien und fand immerhin 119, eine Zahl die schon
damals sowohl Befürworter als auch Kritiker überraschte. Zusammengefasst ergibt
sich eine signifikante Effektstärke mit einer Odds Ratio (OR) von 2.45, die auf
1.78 schrumpft, aber immer noch signifikant ist, wenn man nur die besten
Studien nimmt.
Eine Odds Ratio ist eine
Effektstärke, die das Verhältnis von therapeutischen Erfolgen und Misserfolgen
in der Behandlungs- und Kontrollgruppe abbildet, also dichotome Maße zusammenfasst.
Je nachdem, wie das Verhältnis gebildet wird, sind Werte über 1, wie hier, oder
kleiner als 1, wie bei Lüdtke, Indikatoren für Erfolg. Hier bedeutet die OR =
2.45, dass Patienten in der Homöopathiegruppe 2.45 mal so häufig Erfolg hatten,
oder 1.78 mal in den Studien, die höhere methodische Qualität aufwiesen. Beide
Effektstärken waren signifikant. Allerdings zeigte sich eine lineare Abnahme
des Effektes, je höher die methodische Güte der Studie war.
Verschiedene Validitätstypen
Dazu muss man folgendes
wissen: die methodische Güte einer Studie ist kein eindeutiges Merkmal, wie die
Farbe eines Autos. Es gibt zwar Kriterien, wie Verblindung, oder
Randomisierung, etc. Diese bilden aber nur die sog. interne Validität ab, also
die Sicherheit, mit der man sich auf die Schlussfolgerungen einer Studie
verlassen kann. Wichtig ist aber auch die externe Validität, also die
Anwendbarkeit, und die Modellvalidität, also die Sorgfalt, mit der eine Studie
die zu untersuchende Therapie abgebildet hat. Interne und externe Validität
sind eigentlich inkompatibel 13, d.h. man kann sie praktisch nicht in ein und der
selben Studie optimieren sondern braucht dafür unterschiedliche Studientypen,
und Modellvalidität ist sehr schwer zu fassen. Der Befund, den Klaus Linde und
Kollegen dokumentieren, dass mit steigender interner Validität die Effekte
kleiner werden ist ein wohlbekannter Effekt, der praktisch überall zu
beobachten ist. Immerhin hatten auch noch die besten Studien eine signifikante
Effektstärke. Diesen Befund haben zwar dann in der Folge verschiedene Autoren
durch Sekundärpublikationen versucht zu relativieren. Das geht immer und wurde
auch hier so gemacht, indem man eben Gründe sucht, um Studien nicht
einzuschließen und dann eben nur die 5 oder 3 besten Studien nimmt. Dann
verschwindet die Signifikanz der Effekte, weil sich die Variabilität vergrößert
und die statistische Mächtigkeit abnimmt. Aber solche Strategien halte ich
nicht für wissenschaftlich lauter, weswegen ich sie auch nicht weiter
bespreche.
Cucherat et al. 2000
Die Analyse von Cucherat
und Kollegen entstammte einem größeren Evaluationsprojekt und der Publikation
ist anzumerken – und die Autoren machen auch keinen Hehl daraus, dass man versuchte mit allen Mitteln die
verblüffende Signifikanz des Gesamtergebnisses zu reduzieren. Die Zusammenfassung
selber ist vom Standpunkt der Meta-Analyse schwach, weil keine Effektstärken
zusammengefasst wurden sondern eine extrem konservative Methode verwendet
wurde, um die zusammengefasste Signifikanz zu dokumentieren. Das entsprach
eigentlich schon damals nicht dem Stand der Kunst und tut es heute noch
weniger. Die Autoren reduzierten den Gesamtpool an Studien auf die 17 besten
und auch die kommen noch auf ein insgesamt signifikantes Ergebnis. Das
schwindet erst dann, wenn man nur die 5 oder 3 allerbesten nimmt, aber dann hat
man, wie schon oben besprochen, eben das Problem, dass man hohe Variabilität
mit reduzierter statistischer Mächtigkeit paart. Das ist eine schlechte und
technisch auch nicht empfohlene Methode, wenn man einmal die Literatur zur Meta-Analyse
zur Kenntnis nimmt 14-17.
Shang et al 2005
Am häufigsten zitiert wird die Analyse von Shang und Kollegen, die aus dem schweizerischen Programm zur Evaluation der Komplementärmedizin (PEK) hervorgegangen ist. (Aus diesem Programm ist auch ein Health Technology Assessment Report zur Homöopathie entstanden, also ein pragmatischer Überblick. Dieser ist ebenfalls positiv ausgefallen.18) Shang und Kollegen fanden etwas weniger Studien als die Meta-Analysen vor ihnen. Das ist wohl das geringere Problem. Dann ordneten sie alle Studien nach Größe, die größten zuerst. Das hat eine gewisse Berechtigung, denn große Studien sind in aller Regel robuster in der Schätzung von Effekten als kleine, einfach weil bei ihnen die Schätzfehler statistisch gesehen geringer sind. Allerdings darf man folgendes nicht übersehen: Die Größe einer Studie, das hatten wir im vorigen Teil bereits gesehen, hängt auch davon ab, ob es für eine Krankheit bereits andere Therapien gibt, ob eine Therapie ganz neu ist, wie groß die zu erwartenden Effekte sind, etc. Bei Studien, die auf Pilotstudien aufbauen, die einen relativ großen Effekt gezeigt haben, wird sowohl aus ethischen als auch aus wirtschaftlichen Gesichtspunkten eine relativ kleine Studie ausreichen, den Effekt zu zeigen. Bei Studien, die einen eher kleinen Effekt antizipieren, wird die Studie größer geplant. Daher das Vorgehen, nur die größten Studien zu berücksichtigen, nur in Grenzen sinnvoll.
Der entscheidende, und
häufig kritisierte Schritt der Autoren war nun aber, lediglich acht aller
Studien in die formale Analyse einzuschließen. Dieses Vorgehen wurde nirgends
begründet, war nicht apriori definiert und wurde auch anschließend nie
begründet. Erst auf vielfältigen Druck und Kritik hin19,20 gaben die Autoren auf ihrer Webseite bekannt,
welches die 8 Studien waren, die eingeschlossen wurden. Das ist aus meiner
Sicht ein inakzeptables Vorgehen, und eigentlich verstößt es gegen die Praxis
guter Meta-Analysen, weswegen sich der Kenner wundern muss, warum Lancet diese
Arbeit überhaupt zur Publikation angenommen hat. Wenn man nur diese 8 Studien
analysiert, ergibt sich eine nicht-signifikante Effektstärke. Außerdem haben
Shang und Kollegen noch eine weitere methodische Besonderheit eingebaut: sie
haben zu jeder Homöopathie-Studie zufällig eine konventionelle Vergleichsstudie
gesucht. Wenn man das macht, dann sieht man, dass die Effektstärken der konventionellen
Studien auf einen Punkt konvergieren, der von Null verschieden ist, die Effekte
der Homöopathiestudien aber gegen Null gehen und also von Placebo nicht
verschieden sind.
Allerdings haben Shang
und Kollegen nie den Gesamteffekt aller Studien berichtet, außer dass sie in
ihrer Publikation gesagt haben, er sei signifikant.
Lüdtke & Rutten (2008)
Dies haben Lüdtke und
Rutten in einer Re-Analyse der Shang-Daten nachgeholt. Sie haben zunächst die
Analyse von Shang wiederholt und kamen zum gleichen Ergebnis. In einer sog.
Sensitivitätsanalyse haben sie dann überprüft unter welchen Bedingungen der
Effekt auftaucht und verschwindet. Sensitivitätsanalysen sind eigentlich
Standard in der Meta-Analyse, und man muss sich wundern, warum Shang und
Kollegen diese nicht selber durchgeführt und publiziert haben (und warum die
Gutachter von Lancet bzw. der Herausgeber das nicht eingefordert haben). Solche
Analysen zeigen nämlich, wie robust die Ergebnisse gegenüber den Vorannahmen
sind. Da jede Meta-Analyse immer auch Annahmen trifft, ist es wichtig zu
überprüfen, welchen Einfluss diese Annahmen auf die Robustheit des Ergebnisses
haben, in diesem Fall etwa die Annahme dass es sinnvoll und richtig ist, die
Daten nach Studiengröße zu ordnen und nur 8 aufzunehmen. Lüdtke und Rutten
haben nun eine Analyse gerechnet, in der sie sukzessive immer mehr Studien
einschlossen. Man sieht dabei: die Zahl von 8 Studien bezeichnet einen Punkt,
an dem eine kumulative Meta-Analyse in den nicht-signifikanten Bereich kommt,
nimmt man mehr Studien hinzu, wird die Effektgröße wieder signifikant, dann
wieder nicht. Ab 14 Studien und bis zum Schluss, also zum Einschluss aller
Studien, wird man immer eine signifikante Effektgröße finden, die immer um die
Größe von OR = 0.76 schwankt, aber dann eben immer signifikant ist. Diese
Effektgröße bedeutet, dass der Effekt unter Placebo 24% schwächer ist als unter
Verum.
Es ist wichtig sich noch
einmal vor Augen zu halten: Die Effektgröße schätzt den klinischen Effekt einer
Intervention gegenüber Kontrolle, in dem Fall Placebo. Die
Signifikanzberechnung fragt, ob dieser Effekt eine Zufallsschwankung darstellt
oder nicht. Sie hängt im Wesentlichen davon ab, ob die Effektgrößen sehr stark
schwanken, also davon, wie hoch die Variabilität der individuellen Effektgrößen
in allen Studien ist, und davon, wie viele Studien zusammengefasst werden. Ist
die Variabilität gering, dann können auch schon wenige, konvergierende Studien
einen signifikanten Effekt zeigen. Umgekehrt müssen bei einer hohen
Variabilität wie hier, viele Studien zusammengefasst werden, um einen
signifikanten Effekt zu zeigen. Die Re-Analyse von Lüdtke und Rutten zeigt: es
müssen 14 Studien sein, um einen robusten Effekt schätzen zu können, der immer
signifikant ist. Das ist eigentlich bei insgesamt 110 Studien gar nicht übel
und lässt im Nachhinein die Frage als berechtigt erscheinen, warum Shang und
Kollegen sich auf 8 Studien kapriziert haben. Weil sie dann einen
nicht-signifikanten Effekt belegen konnten? Weil die 8. Studie meine eigene
war, die insgesamt die größte negative Effektstärke in der ganzen Literatur
zeigt?21 Weil sie die Studiengröße von 100 als Grenzwert
sahen? Warum aber dann meine Studie als 8. einschließen, die 98 Teilnehmer
hatte und nicht 100? Wäre diese weggelassen worden und nur 7 Studien
eingeschlossen worden, dann wäre der Effekt wieder signifikant geworden. Man
sieht: die Übung von Lüdtke und Rutten war keineswegs umsonst. Denn sie zeigt,
wie anfällig die Analyse von Shang und Kollegen gegenüber Entscheidungen ist.
Und wenn Entscheidungen, wie hier, nicht rational begründet wurden, regt sich
der Verdacht, dass Vormeinungen eine größere Rolle spielten als die
leidenschaftslose Suche nach dem richtigen Vorgehen.
Außerdem zeigte die Analyse
von Lüdtke und Rutten: den größten Einfluss auf die Signifikanz der Daten nimmt
eine einzige negative Studie, die auch zu den größten überhaupt gehört, bei der
Arnica zur Verhinderung eines Muskelkaters bei Marathonläufern verwendet wurde.22 Man kann sich zu Recht fragen, inwiefern eine
solche Anwendung eine Aussagekraft für klinisch angewandte individualisierte
Homöopathie hat. Schließt man diese Studie aus, dann ist der Effekt immer
positiv, auch bei einem Datensatz von 7 Studien.
Mathie et al (2014)
Die Analyse von Mathie
hatte explizit das Ziel, nur individualisierte, klassische oder
individualisierte Homöopathie zu untersuchen. Sie fand einen signifikanten
Effekt von OR = 1.53, der bei den methodisch besten Studien auf 1.98 anstieg.
Ein Kranker, der in einer Homöopathiegruppe behandelt wird ist also um mehr als
50% besser dran als einer, der in einer Placebo-Gruppe behandelt wird. Nimmt
man nur die besten Studien dann ist der Behandlungserfolg in der
Homöopathiegruppe sogar fast doppelt so gut als in der Placebogruppe. Beide
Effektschätzungen sind signifikant, also überzufällig von Null verschieden.
Robert Hahn, ein Schmerztherapeut
aus Linköping in Schweden, wo damals ein heftiger Streit über anthroposophische
und homöopathische Medizin tobte, wollte
sich einfach einmal informieren; er war weder Homöopath noch kannte er sich
vorher in der Literatur aus. Er sichtete daher neugierig und interessiert die
Literatur und stellte die Meta-Analysen, die ich oben besprochen habe,
zusammen. 23 Er stellte erstaunt fest: Nur wenn man 90% bis
95% aller vorhandenen Studien ignoriert, kann man behaupten, die Homöopathie
sei von Placebo nicht zu unterscheiden.
Ich persönlich stimme dem
zu. Es ist eine merkwürdige Praxis, möglichst viele Studien aus der
Effektberechnung auszuschließen, wie das Cucherat, Shang und andere immer
wieder gemacht haben. Schließlich versucht man in jeder Meta-Analyse und in
jedem systematischen Literaturüberblick alle Daten zu erfassen, sogar solche,
die in obskuren Zeitschriften publiziert sind, die gar nicht publiziert sind
oder die nur als Abstract oder Buchkapitel erschienen sind. Und im Normalfall
ist eine Meta-Analyse umso gründlicher und zuverlässiger, je mehr Daten sie
berücksichtigt. Gerade hier, bei der Homöopathie, wollen manche diese Praxis
umkehren. Das Argument dafür ist: Nur die größten und zuverlässigsten
Einzelschätzungen sind hilfreich. Dann kann man auch gleich wieder zu der Idee
zurückkehren, mit einer einzigen, großen Studie alles entscheiden zu wollen.
Weil genau das gar nicht geht, hat man ja die Idee der Meta-Analyse entwickelt.
Aber genau für die Homöopathie soll das nun anders sein? Merkwürdige Logik.
(Selbst-)Kritische Gedanken
Ich persönlich meine, man kann das Motiv der kritischen Forscher und Literaturübersichten verstehen. Allerdings explizieren sie das Motiv nicht ganz genau. Hier ist eine kurze Rekonstruktion: Die gewöhnliche, sog. frequentistische Statistik, geht davon aus, dass wir nichts, aber auch gar nichts über den zu erforschenden Effekt wissen, dass also die Ausgangswahrscheinlichkeit 50:50 ist, dass wir einen Effekt finden. Das ist immer dann der Fall, wenn wir z.B. eine neue Substanz testen, von der wir nichts wissen. Allerdings haben wir dann, wenn wir z.B. erste Daten aus Tierversuchen und aus theoretischen Überlegungen haben bereits ein gewisses Vorwissen und unsere Ausgangswahrscheinlichkeit verschiebt sich. Streng genommen ist dann die klassische Statistik gar nicht mehr anwendbar und man müsste eine sog. Bayes’sche Statistik verwenden. Diese geht auf den irischen Pastor Bayes zurück, der klar erkannt hat, dass unsere Entscheidungen abhängig davon sind, welche Ausgangswahrscheinlichkeiten („prior odds“ oder „priors“) wir haben. Denn davon hängt ab, wie wir ein empirisches Ergebnis bewerten und welche Endwahrscheinlichkeit („posterior odds“ oder „posteriors“) entsteht. Das Gefüge unserer wissenschaftlichen Entscheidung enthält also nicht nur das nackte Ergebnis einer Studie, sondern das Ergebnis, bewertet auf dem Hintergrund unseres Vorwissens.
Diese Situation führt nun
dazu dass Menschen, die implizit oder explizit skeptisch sind, der Homöopathie
eher eine sehr niedrige Ausgangswahrscheinlichkeit – „prior odds“ – zubilligen.
Wenn diese sehr niedrig ist, dann muss ein empirisches Ergebnis sehr mächtig
sein, um diese zu verschieben und einen Skeptiker zu überzeugen. Genauer
gesagt: das geht praktisch nicht. Denn so stark sind empirische Ergebnisse nie.
Die Forschung ist fehlerbehaftet, die Studien sind nicht mächtig genug, oder
man müsste extrem viele machen, was unrealistisch ist. Und vor allem: solange
keine brauchbare Theorie der homöopathischen Wirkung existiert wird auch das
stärkste empirische Ergebnis die theoretische Ausgangsskepsis nicht verändern
können.
Wer will, kann diese Situation an einem Bayes-Rechner im Internet nachvollziehen; im Menu „interpret p-values“ wählen).
Man gibt hier bei „alpha“ den empirischen p-Wert ein, z.B. das empirische Ergebnis der Meta-Analyse von Cucherat 0.000038. Man wählt eine vernünftige statistische Mächtigkeit oder Power (siehe https://harald-walach.de/methodenlehre-fuer-anfaenger/13-power-analyse-die-magie-der-statistik-oder-der-unterschied-zwischen-signifikanz-und-relevanz/), also z.B. 90%. Dann kann man bei „prior probability“ die Ausgangswahrscheinlichkeit eingeben, z.B. 50% für jemanden, der eine ausgewogene Ausgangssituation hat, oder 0.1% für einen starken Zweifler, 0.0001% für einen extremen Skeptiker, oder 80% für einen der Homöopathie sehr Gewogenen. Dann erhält man die Endwahrscheinlichkeit (posterior odds) und sieht, wie stark die Ausgangswahrscheinlichkeit die Endwahrscheinlichkeit prägt. Für einen ausgewogenen Menschen, der keine Vormeinung hat, reicht eine starke Studie, um seine Endwahrscheinlichkeit fast in Sicherheit zu verwandeln und bei einem positiv der Homöopathie Zugeneigten sowieso. Aber bei einem Skeptiker wird eine solche Studie gar keine großartige Verschiebung der Position bewirken.
Aus diesem Grund sind
diese Wahrscheinlichkeiten aus Studien eher theoretische Größen, die praktisch,
je nach Ausgangssituation, ganz unterschiedlich bewertet werden. Weil die
Menschen sich dieser Situation meist nicht bewusst sind, werden dann alle möglichen
anderen Gründe aus dem Hut gezaubert. Ehrlicher wäre es zu sagen: „Ich glaube
einfach nicht, dass Homöopathie funktionieren kann. Daher wird mich auch ein
noch so starkes empirisches Ergebnis nie und nimmer überzeugen.“ Oder wie es
Daniel Dennett einmal angesichts der Diskussion um die Parapsychologie, für die
ähnliche Verhältnisse gelten, gesagt hat: „Wenn diese Daten stimmen würden,
dann würde ich mich umbringen.“ 24, p. 269 Daher wird die Diskussion um die Wirksamkeit der
Homöopathie nie und nimmer nur eine simple empirische Frage sein. Wäre sie das,
wäre die Frage schon entschieden: die meisten Meta-Analysen, vor allem der
komplette Datensatz der klinischen Homöopathiestudien, egal wie man sie analysiert,
zeigen, dass Homöopathie von Placebo verschieden ist und also im herkömmlichen
Sinne wirksam ist. Aber eben nur, wenn man mit einer offenen Sicht oder einer
Ausgangswahrscheinlichkeit von 0,5 an die Daten herantritt.
Ein weiterer kritischer
Gedanke:
Ein zentrales Anliegen
von Forschung ist es, Fehler und Schwankungen zu korrigieren. Die Physiker zum
Beispiel akzeptieren Daten normalerweise erst dann, wenn ein Effekt mit einer
Wahrscheinlichkeit gesichert wurde, der 5 Standardabweichungen der Standardnormalverteilung
entspricht, das berühmte „5 Sigma“. Das entspricht einer Wahrscheinlichkeit von
p = 10-6, oder einer Kommazahl mit 6 Nullen hinter dem Komma. So
stark sind die Effekte der homöopathischen Meta-Analysen bei weitem nicht.
Allerdings gilt das für die gesamte Medizin, wie Horton, der Herausgeber von
Lancet vor Kurzem einmal angemahnt hat 25. Der Unterschied ist, dass es für die Medizin
insgesamt einen stillschweigenden Konsens gibt (und eine moderat robuste
Datenbasis, würde ich sagen), dass die Ausrichtung, die theoretische Fundierung
und daher die Bewertung der Ergebnisse solide sind. Manche bezweifeln das, vor
allem angesichts der massiven Replikationskrise nicht nur in der Medizin und
der Psychologie 26, sondern auch anderswo. 27,28 Aber insgesamt sind die Kritiker doch eher
geneigt, den konventionellen Daten Glauben zu schenken, auch wenn sie
verglichen mit denen der Homöopathie so verschieden und so besser oft nicht
sind. Das hat aber wie gesagt eher theoretische und ideologische Gründe.
Allerdings muss man eines
zugestehen: Es ist in der Homöopathie sehr schwierig replizierbare Befunde
innerhalb eines Modells zu erzeugen, also z.B. 5 oder 10 Studien zum gleichen
Krankheitsbild und mit der gleichen Methode zu machen, und dabei die
ursprünglichen Effekte zu reproduzieren. Wo das versucht wurde, z.B. beim
erfolgreichen Modell von Brigo mit Homöopathie bei Migräne – die wohl
erfolgreichste Studie in der gesamten Homöopathie-Literatur 3 – da scheiterten die Nachfolgeversuche bzw. zeigten
wesentlich schwächere Effekte 4,21,29. Man sieht das auch teilweise bei den
erfolgversprechenden Versuchen von David Reilly, die wir besprochen haben (https://www.homöopathie-forschung.info/klassische-studien_heuschnupfen/). Zwar sind Einzelstudien sehr erfolgreich
gewesen und die Meta-Analyse über alle Studien ist signifikant 30. Es gibt aber auch spektakulär gescheiterte
Replikationen 31. Ob das anders und deutlicher ist als in der
konventionellen Medizin weiß ich nicht; das mögen andere beurteilen. Auf jeden
Fall zeigt diese Situation: wir haben die Homöopathie noch nicht gut genug
verstanden. Ich persönlich bin der Meinung, dass sich dahinter eine völlig
andere Kategorie von Effekten zeigt, die wir momentan nicht in unser
wissenschaftliches Weltbild einordnen können.32-34 Daher ist auch der Kampf so heiß. Aber dies ist
eine sehr spezialisierte Diskussion, die weit über die Frage der Wirksamkeit
hinaus geht; daher will ich sie hier beschließen und vielleicht ein andermal
wieder aufgreifen.
Fassen wir zusammen:
Die mehrfachen
Meta-Analysen zur Homöopathie kommen in der Mehrzahl zu dem Schluss, dass
Homöopathie von Placebo unterscheidbar ist. Man kann dieses Resultat ignorieren
oder man kann es auch negieren, wenn man 90% bis 95% aller Daten ausschließt.
Dann kann man auch getrost die Behauptung aufstellen, Homöopathie sei Placebo.
Ob das lauter, sachgerecht und sinnvoll ist? Ich finde, das ist eine Verzerrung
der Sachlage. Wenn man, wie bei Meta-Analysen üblich, alle Daten zusammenfasst,
zeigt sich klar, dass Homöopathie von Placebo signifikant unterscheidbar ist.
Für einen extremen Kritiker und Skeptiker, der mit einer starken negativen
Vormeinung zur Plausibilität der Homöopathie die Daten beurteilt, wird die
statistische Signifikanz nicht ausreichen, um seine Skepsis zu überwinden. Aber
wenn man unvoreingenommen an die Daten herantritt muss man eingestehen:
Homöopathie ist Placebo überlegen, jedenfalls über alle Studien hinweg. Das
gilt für die individualisierte, klassische Homöopathie, aber auch für die
vielen Studien, die die Homöopathie auf einfachere Weise modelliert haben.
Daher ist es auch gerechtfertigt, um auf unsere Ausgangsfrage zurückzukommen,
wenn der Gesetzgeber im Arzneimittelgesetz homöopathischen Einzelmitteln den je
individuellen Nachweis der Wirksamkeit erlässt.
Referenzen
- Wiesenauer M, Gaus W. Wirksamkeitsnachweis eines Homöopathikums bei chronischer Polyarthritis. Eine randomisierte Doppelblindstudie bei niedergelassenen Ärzten. Aktuelle Rheumathologie 1991; 16: 1-9.
- Fisher P, Greenwood A, Huskisson EC, Turner P, Belon P. Effect of homoeopathic treatment on fibrositis (primary fibromyalgia). British Medical Journal 1989; 299: 365-6.
- Brigo B, Serpelloni G. Le traitement homéopathique de la migraine: une étude de 60 cas, controlée en double aveugle (remède homéopathique vs. placebo). Journal of the Liga Medicorum Homoeopatica Internationalis 1987; 1: 18-25.
- Whitmarsh TE, Coleston-Shields DM, Steiner TJ. Double-blind randomized placeo-controlled study of homoeopathic prophylaxis of migraine. Cephalalgia 1997; 17: 600-4.
- Walach H. Verblindung in klinischen Homöopathie-Studien? In: Hornung J, ed. Forschungsmethoden in der Komplementärmedizin Über die Notwendigkeit einer methodologischen Erneuerung. Stuttgart: Schattauer; 1996: 1-16.
- Frei H, Everts R, von Ammon K, et al. Homeopathic treatment of children with attention deficit disorder: a randomised, double-blind, placebo controlled crossover trial. European Journal of Pediatrics 2005; 164: 758-67.
- Witt CM, Lüdtke R, Baur R, Willich SN. Homeopathic medical practice: Long term results of a cohort study with 3981 patients. BMC Public Health 2005; 5: 115.
- Linde K, Clausius N, Ramirez G, et al. Are the clinical effects of homoeopathy placebo effects? A meta-analysis of placebo controlled trials. Lancet 1997; 350: 834-43.
- Cucherat M, Haugh MC, Gooch M, Boissel JP, HMRAG Group. Evidence of clinical efficacy of homeopathy. A meta-analysis of clinical trials. European Journal of Clinical Pharmacology 2000; 56: 27-33.
- Shang A, Huwiler-Münteler K, Nartey L, et al. Are the clinical effects of homeopathy placebo effects? Comparative study of placebo-controlled trials of homoeopathy and allopathy. Lancet 2005; 366: 726-32.
- Lüdtke R, Rutten ALB. The conclusions on the effectiveness of homeopathy highly depend on the set of analyzed trials. Journal of Clinical Epidemiology 2008; 61: 1197-204.
- Mathie RT, Lloyd SM, Legg LA, et al. Randomised placebo-controlled trials of individualised homoeopathic treatment: sytematic review and meta-analysis. Systematic Reviews 2014; 3(142).
- Walach H, Loef M. Using a matrix-analytical approach to synthesizing evidence solved incompatibility problem in the hierarchy of evidence. Journal of Clinical Epidemiology 2015; 68: 1251-60.
- Hunter JE, Schmidt FL. Methods for Meta-Analysis: Correcting Error and Bias in Research. Newbury Park: Sage; 1990.
- Hunter JE, Schmidt FL, Jackson GB. Meta-Analysis. Cumulating Research Findings Across Studies. Beverly Hills: Sage; 1982.
- Rosenthal R, DiMatteo MR. Meta-Analysis: Recent Developments in Quantitative Methods for Literature Reviews. Annual Review of Psychology 2001; 52(1): 59-82.
- Rosenthal R. Meta-Analytic Procedures for Social Research. Newbury Park: Sage; 1991.
- Bornhöft G, Matthiessen PF, editors. Homeopathy in Healthcare: Effectiveness, Appropriateness, Safety, Costs. Heidelberg: Springer; 2012.
- Walach H, Jonas W, Lewith G. Letter to the Editor: Are the clinical effects of homoeopathy placebo effects? Comparative study of placebo-controlled trials of homoeopathy and allopathy. Lancet 2005; 366: 2081.
- Fisher P, Bell IR, Belon P, et al. Letter to the Editor: Are the clinical effects of homoeopathy placebo effects? Lancet 2005; 366: 2082.
- Walach H, Gaus W, Haeusler W, et al. Classical homoeopathic treatment of chronic headaches. A double-blind, randomized, placebo-controlled study. Cephalalgia 1997; 17: 119-26.
- Vickers AJ, Fisher P, Smith C, Wyllie SE, Rees R. Homoeopathic Arnica 30X is ineffective for muscle soreness after long distance running: A randomized, double-blind, placebo-controlled trial. The Clinical Journal of Pain 1998; 14: 227-31.
- Hahn RG. Homeopathy: Meta-Analyses of pooled clinical data. Forschende Komplementärmedizin 2013; 20: 376-81.
- Bierman DJ. On the nature of anomalous phenomena: Another reality between the world of subjective consciousness and the objective world of physics? In: Van Loocke P, ed. The Physical Nature of Consciousness. New York: Benjamins; 2001: 269–92.
- Horton R. Offline: What is medicine’s 5 sigma? Lancet 2015; 385: 1380.
- Open Science Collaboration. Estimating the reproducibility of psychological science. Science 2015; 349(6251): aac4716.
- Munafò MR, Nosek BA, Bishop DVM, et al. A manifesto for reproducible science. 2017; 1: 0021.
- Ioannidis JPA. Why most published research findings are false. PLoS Medicine 2005; 2(8): e124.
- Straumsheim P, Borchgrevink C, Mowinkel P, Kierulf H, Hafslund O. Homoepathic treatment of migraine: A double blind, placebo controlled trial of 68 patients. British Homeopathic Journal 2000; 89: 4-7.
- Taylor MA, Reilly D, Llewellyn-Jones RH, McSharry C, Aitchison TC. Randomised controlled trial of homoeopathy versus placebo in perennial allergic rhinitis with overview of four trial series. British Medical Journal 2000; 321: 471-6.
- Lewith GT, Watkins AD, Hyland ME, et al. Use of ultramolecular potencies of allergen to treat asthmatic people allergic to house dust mite: double blind randomised controlled clinical trial. British Medical Journal 2002; 324: 520-3.
- Walach H. Magic of signs: a non-local interpretation of homeopathy. British Homeopathic Journal 2000; 89: 127-40.
- Walach H. Entanglement model of homeopathy as an example of generalizsed entanglement predicted by Weak Quantum Theory. Forschende Komplementärmedizin und Klassische Naturheilkunde 2003; 10: 192-200.
- Lucadou Wv, Römer H, Walach H. Synchronistic Phenomena as Entanglement Correlations in Generalized Quantum Theory. Journal of Consciousness Studies 2007; 14(4): 50-74.