1. Nauka
  2. /
  3. Kursy
  4. /
  5. Wnioskowanie w regresji liniowej w R

Connected

ćwiczenie

Zerowy rozkład próbkowania współczynnika kierunkowego

W poprzednim rozdziale analizowałeś rozkład próbkowania współczynnika kierunkowego dla populacji, w której ten współczynnik był różny od zera. Zazwyczaj jednak, aby przeprowadzić wnioskowanie statystyczne, trzeba znać rozkład próbkowania współczynnika kierunkowego przy założeniu hipotezy, że między zmienną objaśniającą a zmienną odpowiedzi nie ma żadnego związku. Co więcej, w większości przypadków nie znamy populacji, z której pochodzą dane – dlatego zerowy rozkład próbkowania należy wyznaczyć wyłącznie na podstawie oryginalnego zbioru danych.

W połowie XX wieku przeprowadzono badanie, w którym śledzono losy identycznych bliźniąt rozdzielonych tuż po urodzeniu: jedno dziecko wychowywało się w domu biologicznych rodziców, a drugie w rodzinie zastępczej. Chcąc odpowiedzieć na pytanie, czy inteligencja jest wynikiem natury czy wychowania, oboje dzieci poddano testom IQ. Uzyskane dane zawierają wyniki IQ bliźniąt wychowanych w rodzinach zastępczych (Foster – zmienna odpowiedzi) oraz wyniki IQ bliźniąt wychowanych przez rodziców biologicznych (Biological – zmienna objaśniająca).

W tym ćwiczeniu skorzystasz z funkcji pull(). Przyjmuje ona ramkę danych i zwraca wybraną kolumnę jako wektor (podobnie jak operator $).

Instrukcje 1/2

undefined XP
  • 1
    • Wykonaj regresję liniową zmiennej Foster względem Biological na zbiorze danych twins.
    • Uporządkuj wynik za pomocą funkcji tidy().
    • Przefiltruj wiersze, w których term jest równe "Biological".
    • Użyj pull(), aby wyciągnąć kolumnę estimate.
  • 2

    Zasymuluj 10 wartości współczynnika kierunkowego.

    • Użyj specify(), aby określić relację Foster względem Biological (ta sama formuła co w regresji liniowej).
    • Użyj hypothesize(), aby ustawić hipotezę zerową (null) jako "independence".
    • Użyj generate(), aby wygenerować 10 replikacji (reps) typu (type) "permute".
    • Użyj calculate(), aby obliczyć statystykę podsumowującą (stat) "slope".