Exkurs: Korrelation
Wenn du mit Statistik vertraut bist, hast du sicher von der Pearson-Korrelation gehört. Sie misst die lineare Abhängigkeit zwischen zwei Variablen, sagen wir \(X\) und \(Y\). Der Wert liegt zwischen -1 und 1; liegt er nahe bei 1, besteht eine starke positive Beziehung zwischen den Variablen. Ist \(X\) hoch, ist tendenziell auch \(Y\) hoch. Liegt der Wert nahe bei -1, besteht eine starke negative Beziehung: Ist \(X\) hoch, ist \(Y\) tendenziell niedrig. Ist die Pearson-Korrelation zwischen zwei Variablen 0, sind diese Variablen möglicherweise unabhängig: Es besteht keine Beziehung zwischen \(X\) und \(Y\).
Du kannst die Korrelation zwischen zwei Vektoren mit der Funktion cor() berechnen. Nimm zum Beispiel diesen Code, der die Korrelation zwischen den Spalten height und width eines fiktiven Data Frames size berechnet:
cor(size$height, size$width)
Die Daten, mit denen du in der vorherigen Übung gearbeitet hast, international.sav, liegen wieder in deinem Arbeitsverzeichnis. Jetzt bist du dran: Importiere sie und führe die richtigen Berechnungen durch, um die folgende Frage zu beantworten:
Wie lautet der Korrelationskoeffizient für die beiden numerischen Variablen gdp und f_illit (weibliche Analphabetenrate)?
Diese Übung ist Teil des Kurses
Fortgeschrittenes Importieren von Daten in R
Interaktive Übung
In dieser interaktiven Übung kannst du die Theorie in die Praxis umsetzen.
Übung starten