SE przy mniejszej ilości danych

Im mniej danych masz do dyspozycji, tym większa niepewność towarzyszy szacunkowi. Odzwierciedla to błąd standardowy. W tym ćwiczeniu poczujesz tę zależność, analizując zbiory danych o różnych rozmiarach.

Na podstawie gss2016 przygotowano dla ciebie dwa mniejsze zbiory danych: gss2016_small zawierający 50 obserwacji oraz gss2016_smaller zawierający zaledwie 10 obserwacji.

1
- Korzystając ze zbioru gss2016_small, utwórz rozkład bootstrapowy o nazwie boot_dist_small, wykonując znane kroki:
- specify — wskaż, że interesujesz się zmienną consci, gdzie sukces oznacza wartość "High".
- generate — wygeneruj 500 replik bootstrapowych.
- calculate — oblicz proporcję dla każdej repliki.

2
Oblicz błąd standardowy rozkładu boot_dist_small jako jego odchylenie standardowe, wyodrębnij tę wartość i zapisz ją do SE_small_n.
3
- Powtórz proces generowania rozkładu bootstrapowego dla zbioru gss2016_smaller i zapisz wynik do boot_dist_smaller. Zaoszczędź sobie czasu — skopiuj poprzedni blok kodu i zamień nazwę zbioru danych.
4
- Powtórz proces wyodrębniania błędu standardowego z boot_dist_smaller i zapisz wynik do SE_smaller_n. Tutaj znów przyda się kopiowanie i wklejanie kodu.
- Uruchom kod, aby porównać oba błędy standardowe i odpowiadające im wielkości prób. Jak wielkość próby wpływa na błąd standardowy?

ćwiczenie

SE przy mniejszej ilości danych

Instrukcje 1/4

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}ćwiczenie

Instrukcje 1/4

ćwiczenie