1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Inference for Linear Regression in R

Connected

cvičení

Nulové výběrové rozdělení směrnice

V předchozí kapitole jsi zkoumal/a výběrové rozdělení směrnice z populace, kde směrnice nabývala nenulové hodnoty. Při inferenci ale většinou potřebuješ znát výběrové rozdělení směrnice za předpokladu, že mezi vysvětlující a odezvovou proměnnou neexistuje žádný vztah. Navíc v praxi zpravidla neznáš populaci, ze které data pocházejí – nulové výběrové rozdělení proto musíš odvodit výhradně z původního datasetu.

V polovině 20. století bylo provedeno výzkumné šetření, které sledovalo jednovaječná dvojčata odloučená po narození: jedno dítě vyrůstalo u biologických rodičů a druhé v náhradní rodině. Cílem bylo zjistit, zda je inteligence výsledkem přírody, nebo výchovy – obě děti proto absolvovaly IQ testy. Data obsahují IQ skóre dvojčat vychovaných v náhradní rodině (Foster jako odezvová proměnná) a IQ skóre jejich biologických sourozenců (Biological jako vysvětlující proměnná).

V tomto cvičení použiješ funkci pull(). Ta přijme datový rámec a vrátí vybraný sloupec jako vektor (podobně jako operátor $).

Instrukce 1/2

undefined XP
  • 1
    • Proveď lineární regresi Foster vs. Biological na datasetu twins.
    • Výsledek upravdě pomocí tidy().
    • Filtruj řádky, kde term odpovídá "Biological".
    • Pomocí pull() vytáhni sloupec estimate.
  • 2

    Nasimuluj 10 hodnot směrnice.

    • Pomocí specify() specifikuj vztah Foster vs. Biological (stejný vzorec jako pro lineární regresi).
    • Pomocí hypothesize() nastav nulovou hypotézu "independence".
    • Pomocí generate() vygeneruj 10 replikátů (reps) typu "permute".
    • Pomocí calculate() vypočítej souhrnnou statistiku (stat) "slope".