1. Nauka
  2. /
  3. Kursy
  4. /
  5. Wnioskowanie dla danych kategorycznych w R

Connected

ćwiczenie

SE przy mniejszej ilości danych

Im mniej danych masz do dyspozycji, tym większa niepewność towarzyszy szacunkowi. Odzwierciedla to błąd standardowy. W tym ćwiczeniu poczujesz tę zależność, analizując zbiory danych o różnych rozmiarach.

Na podstawie gss2016 przygotowano dla ciebie dwa mniejsze zbiory danych: gss2016_small zawierający 50 obserwacji oraz gss2016_smaller zawierający zaledwie 10 obserwacji.

Instrukcje 1/4

undefined XP
  • 1
    • Korzystając ze zbioru gss2016_small, utwórz rozkład bootstrapowy o nazwie boot_dist_small, wykonując znane kroki:
    • specify — wskaż, że interesujesz się zmienną consci, gdzie sukces oznacza wartość "High".
    • generate — wygeneruj 500 replik bootstrapowych.
    • calculate — oblicz proporcję dla każdej repliki.
  • 2

    Oblicz błąd standardowy rozkładu boot_dist_small jako jego odchylenie standardowe, wyodrębnij tę wartość i zapisz ją do SE_small_n.

  • 3
    • Powtórz proces generowania rozkładu bootstrapowego dla zbioru gss2016_smaller i zapisz wynik do boot_dist_smaller. Zaoszczędź sobie czasu — skopiuj poprzedni blok kodu i zamień nazwę zbioru danych.
  • 4
    • Powtórz proces wyodrębniania błędu standardowego z boot_dist_smaller i zapisz wynik do SE_smaller_n. Tutaj znów przyda się kopiowanie i wklejanie kodu.
    • Uruchom kod, aby porównać oba błędy standardowe i odpowiadające im wielkości prób. Jak wielkość próby wpływa na błąd standardowy?