1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Vzorkování v Pythonu

Connected

cvičení

Výpočet relativní chyby

Velikost vzorku ovlivňuje to, jak přesně bodové odhady odrážejí odpovídající parametr celé populace. Když například vypočítáš průměr vzorku, chceš, aby se co nejvíce blížil průměru populace. Pokud je ale vzorek příliš malý, nemusí tomu tak být.

Nejběžnější metrikou pro hodnocení přesnosti je relativní chyba. Jde o absolutní rozdíl mezi parametrem populace a bodovým odhadem, vydělený hodnotou parametru populace. Někdy se vyjadřuje v procentech.

K dispozici máš attrition_pop a mean_attrition_pop (průměr sloupce Attrition datasetu attrition_pop); pandas je načtený jako pd.

Instrukce 1/2

undefined XP
  • 1
    • Vygeneruj jednoduchý náhodný vzorek z attrition_pop o padesáti řádcích a nastav seed na 2022.
    • Vypočítej průměrnou hodnotu Attrition zaměstnanců ve vzorku.
    • Vypočítej relativní chybu mezi mean_attrition_srs50 a mean_attrition_pop jako procento.
  • 2
    • Vypočítej relativní chybu v procentech znovu. Tentokrát použij jednoduchý náhodný vzorek o sto řádcích z attrition_pop.