1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Statistické simulace v Pythonu

Connected

cvičení

Nestandardní odhadce

V předchozím cvičení jsi spustil/a jednoduchý bootstrap, který teď upravíme pro složitější odhadce.

Představ si, že zkoumáš zdravotní stav studentů. Máš k dispozici výšky a váhy 1 000 studentů a zajímá tě medián výšky, korelace mezi výškou a váhou a příslušné 95% intervaly spolehlivosti pro tyto veličiny. Použijeme bootstrapping.

Prohlédni si DataFrame df z knihovny pandas, který obsahuje výšky a váhy 1 000 studentů. Na základě těchto dat vypočítej 95% interval spolehlivosti pro medián výšky i pro korelaci mezi výškou a váhou.

Pokyny

100 XP
  • Pomocí metody .sample() na df vygeneruj vzorek dat s opakováním a přiřaď ho do tmp_df.
  • Pro každý vygenerovaný dataset v tmp_df vypočítej medián výšek a korelaci mezi výškou a váhou pomocí .median() a .corr().
  • Přidej medián výšek do height_medians a korelaci do hw_corr.
  • Nakonec vypočítej 95% ([2.5, 97.5]) intervaly spolehlivosti pro obě výše uvedené veličiny pomocí np.percentile().