1. Nauka
  2. /
  3. Kursy
  4. /
  5. Myślenie statystyczne w Pythonie (część 2)

Connected

ćwiczenie

Dlaczego ten parametr jest optymalny?

Teraz pobierz próbki z rozkładu wykładniczego, gdzie \(\tau\) jest dwa razy większe od optymalnego \(\tau\). Powtórz to samo dla \(\tau\) dwa razy mniejszego. Wyznacz dystrybuanty empiryczne tych próbek i nałóż je na wykres z danymi. Zobaczysz, że nie odwzorowują danych tak dobrze. To pokazuje, że \(\tau\) obliczone ze średnich czasów między no-hitterami jest optymalne – najlepiej odtwarza ono strukturę danych.

Uwaga: W tym i wszystkich kolejnych ćwiczeniach generator liczb losowych jest z góry ustawiony na stały ziarno, żebyś nie musiał go za każdym razem wpisywać.

Instrukcje

100 XP
  • Pobierz 10000 próbek z rozkładu wykładniczego z parametrem \(\tau_{1/2}\) = tau/2.
  • Pobierz 10000 próbek z rozkładu wykładniczego z parametrem \(\tau_{2}\) = 2*tau.
  • Wyznacz dystrybuanty empiryczne obu zestawów próbek, korzystając z funkcji ecdf().
  • Dodaj te dwie dystrybuanty jako linie do wykresu. Ten krok jest już wykonany – kliknij Prześlij odpowiedź, aby zobaczyć wykres!