1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Vzorkování v Pythonu

Connected

cvičení

Prosté náhodné vzorkování

Nejjednodušší metodou vzorkování populace je ta, kterou už znáš. Říká se jí prosté náhodné vzorkování (zkráceně „PNV" nebo anglicky "SRS") a spočívá v náhodném výběru řádků jeden po druhém, přičemž každý řádek má stejnou šanci být vybrán jako kterýkoli jiný.

V této kapitole budeš aplikovat metody vzorkování na syntetický (fiktivní) dataset odchodu zaměstnanců od IBM, kde „attrition" v tomto kontextu znamená odchod ze společnosti.

K dispozici máš attrition_pop; pandas je načteno jako pd.

Pokyny

100 XP
  • Z datasetu attrition_pop vyber pomocí prostého náhodného vzorkování 70 řádků a nastav náhodný seed na 18900217.
  • Vypiš vzorový dataset attrition_samp. Co si všimneš na indexech?