1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Intermediate Importing Data in R

Connected

cvičení

Odbočka: Korelace

Pokud se vyznáš ve statistice, určitě jsi slyšel/a o Pearsonově korelaci. Jde o míru lineární závislosti mezi dvěma proměnnými, řekněme \(X\) a \(Y\). Nabývá hodnot od -1 do 1: hodnota blízká 1 znamená silnou pozitivní závislost – když je \(X\) vysoké, bývá vysoké i \(Y\). Hodnota blízká -1 naopak indikuje silnou negativní závislost: když je \(X\) vysoké, \(Y\) bývá nízké. Pearsonova korelace rovná 0 naznačuje, že proměnné jsou pravděpodobně nezávislé – mezi \(X\) a \(Y\) neexistuje žádná asociace.

Korelaci mezi dvěma vektory vypočítáš pomocí funkce cor(). Podívej se na tento příklad, který počítá korelaci mezi sloupci height a width fiktivního datového rámce size:

cor(size$height, size$width)

Data z předchozího cvičení, international.sav, jsou znovu k dispozici v tvém pracovním adresáři. Teď je naimportuj a proveď potřebné výpočty, abys dokázal/a odpovědět na následující otázku:

Jaký je korelační koeficient pro dvě numerické proměnné gdp a f_illit (míra negramotnosti žen)?

Pokyny

50 XP

Možné odpovědi