1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Statistical Thinking in Python (Part 2)

Connected

cvičení

Vizualizace bootstrap vzorků

V tomto cvičení budeš generovat bootstrap vzorky ze sady dat o ročních srážkách naměřených na meteorologické stanici Sheffield ve Velké Británii v letech 1883 až 2015. Data jsou uložena v NumPy poli rainfall v milimetrech (mm). Grafickým zobrazením bootstrap vzorků pomocí ECDF získáš představu o tom, jak bootstrap vzorkování umožňuje pravděpodobnostní popis dat.

Pokyny

100 XP
  • Napiš smyčku for, která vygeneruje 50 bootstrap vzorků dat o srážkách a vykreslí jejich ECDF.
    • Pomocí np.random.choice() vygeneruj bootstrap vzorek z NumPy pole rainfall. Dbej na to, aby mělo převzorkované pole velikost len(rainfall).
    • Pomocí funkce ecdf(), kterou jsi napsal/a v předchozím kurzu, vygeneruj hodnoty x a y pro ECDF bootstrap vzorku bs_sample.
    • Vykresli hodnoty ECDF. Kromě argumentů marker='.' a linestyle='none' zadej také color='gray' (pro šedé tečky) a alpha=0.1 (pro poloprůhlednost, protože překrýváš velké množství vzorků).
  • Pomocí ecdf() vygeneruj hodnoty x a y pro ECDF původních dat o srážkách uložených v poli rainfall.
  • Vykresli hodnoty ECDF původních dat.
  • Klikni na Submit Answer a vizualizuj vzorky!