Korrelationen – Lars und die Welt

Korrelation heißt noch nicht Kausalität, das wisst ihr alle. Aber Korrelationen sind echte und wichtige Ergebnisse in der Wissenschaft. Da entsteht manchmal ein falscher Eindruck.
Ich habe jetzt ein paar mal erlebt, dass das missverständlich erklärt wurde, das letzte Mal von Professor Dirnagl von der Charité beim science slam in der Volksbühne Berlin. Deswegen nochmal in meinen Worten, was Korrelation aussagt und was nicht.

45408443_2193786387534663_8112460174305787904_o — falsch positive Korrelation von dieser Seite http://tylervigen.com/spurious-correlations

Eine Korrelation ist ein echter Zusammenhang. Zb je älter ein Mensch, desto mehr graue Haare. Bzw bei Kindern – je älter desto größer.
Kausalität bedeutet, dass eine Sache wirklich die Ursache für eine andere ist. Alter verursacht wirklich Wachstum bei Kindern (bzw die Prozesse, die Wachstum verursachen, brauchen Zeit und damit Alter). Wenn eine Kausalität vorliegt, liegt auch eine Korrelation vor. Umgekehrt aber nicht immer. Älter werden geht bei Kindern mit vielen anderen Sachen einher. Zb können sie immer besser lesen. Lesefertigkeiten korrelieren deswegen auch mit der Schuhgröße. Beides hängt mit dem Alter des Kindes zusammen und ändert sich daher gleichzeitig, korreliert also. Zwischen Lesefähigkeiten und Schuhgröße gibt es aber keine Kausalität. Lesen üben lässt meine Füße nicht größer werden und größere Schuhe anziehen lässt mich nicht besser lesen.
In der Wissenschaft schauen wir oft als erstes nach Korrelationen. Korreliert ein bestimmter Lebensstil mit bestimmten Krankheiten? Wenn ja, ist das eine erster Hinweis auf eine mögliche Kausalität. Deswegen schaut man als nächstes in gezielten Experimenten, ob wirklich eine Kausalität vorliegt oder ob die Korrelation anders erklärt werden muss. Zb. findet man viele Unterschiede in Krankheitswahrscheinlichkeiten zwischen armen und reichen Menschen. Wahrscheinliche Ursachen sind, wie gut die ärztliche Versorgung und das Essen sind, ob man genug Freizeit für Sport hat, usw. Jetzt gibt es in anderen Gesellschaftsschichten auch Unterschiede in Mode, Musik, usw. Man dürfte also finden, dass teure Uhren mit verbesserter Gesundheit korrelieren. Trotzdem verursachen sie die natürlich nicht.

Deswegen gilt immer die Warnung, dass Korrelation NOCH keine Kausalität ist. Sie ist ein Hinweis, reicht aber nicht als Beweis.

Unabhängig davon gibt es noch das Problem der statistischen Signifikanz. Ob zwei Faktoren korrelieren oder nichts miteinander zu tun haben, wird als statistische Wahrscheinlichkeit errechnet. Genauso wie bei der Frage, ob zwei Gruppen wirklich unterschiedlich sind (zb: sind die Patienten mit Medikament gesünder als die mit Placebo?). Ist die Wahrscheinlichkeit, dass eine scheinbare Korrelation nur zufällig so aussieht, obwohl sie gar nicht vorliegt, sehr klein, gehen wir davon aus, dass sie echt ist. Das nennt man statistisch signifikant. “Sehr klein” bedeutet normalerweise 5%.
In der Praxis bedeutet das, dass ich in 5% der Fälle, in denen ich völlig unzusammenhängende Sachen ansehe, eine scheinbare, statistisch signifikante, Korrelation herausbekomme. Das gilt wie gesagt nicht nur für Korrelation, sondern auch für alles andere, das wir mit statistischen Methoden testen. Also auch für unsere gezielten Experimente zur Kausalität.

Professor Dirnagl hat in seinem Vortrag eine solche scheinbare Korrelation zitiert, die von dieser, ziemlich lustigen, Seite kommt. http://tylervigen.com/spurious-correlations
Da werden aus riesigen Datenbergen Sachen auf Korrelation getestet. Zb finden sie, dass weniger Menschen aus ihrem Angelboot fallen und ertrinken, wenn es in Kentucky weniger Hochzeiten gibt.
In seinem Vortrag hatte er erwähnt, dass ein Zusammenhang zwischen Darmflora und Depressionen gefunden worden war. Um zu zeigen, dass das aber noch nicht heißt, dass die Darmflora Depressionen auch auslöst, zeigte er eine solche Witzkorrelation.
Das vermischt aber zwei Probleme. Die Korrelationen auf der Witzseite sind nur scheinbare Korrelationen, die am Problem der statistischen Signifikanz liegen. Sie sind keine echten Korrelationen, die zwar da wären, aber keine Kausalität bewiesen, wie beim Zusammenhang von Schuhgröße und Lesefertigkeiten.

Ich befürchte, dass nach diesem Vortrag beim Publikum hängen geblieben ist, dass Korrelationen keinen wissenschaftlichen Wert hätten, weil ja irgendwie alles mit jedem korreliere. Das stimmt nicht. Wenn eine Studie schlecht gemacht ist, kann sie dieses Problem haben. Dann wurde alles mit jedem auf Korrelation getestet und nur die signifikanten Korrelationen berichtet. Das ist schlechte Wissenschaft und grenzt an Wissenschaftsbetrug. Das gilt aber wie gesagt nicht nur für Korrelationen, sondern für fast alle Ergebnisse.
Ich kenne die Darmflora-Depressionsstudie nicht, aber gehe mal davon aus, dass sie keine Müllstudie war (hat Dirnagl auch nicht gesagt). Dann wäre das Problem eben, dass es eine Korrelation gibt, die aber noch keine Kausalität belegt. Wahrscheinlicher als dass die Darmbakterien depressiv machen, wäre nämlich, dass Depressive eher andere Sachen oder zu anderen Tageszeiten essen und damit die Darmflora beeinflussen. Ich finde, dass er das an dieser Stelle ausführlicher hätte klarstellen sollen, anstatt den Eindruck zu vermitteln, Korrelationen wären im Allgemeinen unglaubwürdig.

Also: Korrelationen sind echt und wissenschaftlich wertvoll. Sie belegen keine Kausalität, können aber auf eine hinweisen. Schlechte Wissenschaft mit unsauberer Statistik ist ein unabhängiges Problem.

Die Sache mit der statistischen Signifikanz und dem Problem der falschen Treffer in großen Datenbergen erkläre ich noch mal genauer in diesem Video https://youtu.be/M8ylrYgGAYA