1. Nauka
  2. /
  3. Kursy
  4. /
  5. Myślenie statystyczne w Pythonie (część 2)

Connected

ćwiczenie

Wizualizacja próbkowania permutacyjnego

Aby lepiej zrozumieć, jak działa próbkowanie permutacyjne, w tym ćwiczeniu wygenerujesz próbki permutacyjne i przeanalizujesz je graficznie.

Ponownie skorzystamy z danych Sheffield Weather Station – tym razem przyjrzymy się miesięcznym opadom w czerwcu (miesiąc suchy) i w listopadzie (miesiąc mokry). Spodziewamy się, że rozkłady tych danych mogą się różnić, dlatego pobierzemy próbki permutacyjne, aby zobaczyć, jak wyglądałyby ich ECDF, gdyby dane miały identyczny rozkład.

Dane są zapisane w tablicach NumPy rain_june i rain_november.

Dla przypomnienia: permutation_sample() ma sygnaturę permutation_sample(data_1, data_2) i zwraca permuted_data[:len(data_1)], permuted_data[len(data_1):], gdzie permuted_data = np.random.permutation(np.concatenate((data_1, data_2))).

Instrukcje

100 XP
  • Napisz pętlę for, która wygeneruje 50 próbek permutacyjnych, obliczy ich ECDF i wyrysuje je na wykresie.
    • Wygeneruj parę próbek permutacyjnych z rain_june i rain_november przy użyciu funkcji permutation_sample().
    • Wygeneruj wartości x i y dla ECDF każdej z dwóch próbek permutacyjnych, korzystając z funkcji ecdf().
    • Wyrysuj ECDF pierwszej próbki permutacyjnej (x_1 i y_1) w postaci punktów. Zrób to samo dla drugiej próbki permutacyjnej (x_2 i y_2).
  • Wygeneruj wartości x i y dla ECDF danych rain_june i rain_november, a następnie wyrysuj te ECDF, używając odpowiednio argumentów słów kluczowych color='red' i color='blue'.
  • Opisz osie, ustaw margines 2% i wyświetl wykres. Ta część została już za ciebie przygotowana – po prostu prześlij odpowiedź, aby zobaczyć wykres!