1. Nauka
  2. /
  3. Kursy
  4. /
  5. Wprowadzenie do modelowania liniowego w Pythonie

Connected

ćwiczenie

Wizualizacja statystyk testowych

W tym ćwiczeniu zbadasz hipotezę zerową, porównując rozkłady statystyki testowej uzyskane na dwa różne sposoby.

Najpierw przyjrzysz się dwóm „populacjom" podzielonym według wczesnych i późnych momentów czasowych i obliczysz rozkład statystyki testowej. Następnie przetasuj obie populacje – tak, by dane nie były już uporządkowane czasowo i każda z nich zawierała mieszaninę wczesnych i późnych momentów – po czym ponownie oblicz rozkład statystyki testowej.

Aby ułatwić ci start, wczytaliśmy wcześniej dwie grupy czasowe, group_duration_short i group_duration_long, oraz dwie funkcje: shuffle_and_split() i plot_test_statistic().

Instrukcje

100 XP
  • Użyj np.random.choice(), aby przepróbkować group_duration_short i group_duration_long, a następnie oblicz różnicę między próbkami, żeby wyznaczyć test_statistic_unshuffled.
  • Użyj shuffle_and_split() na oryginalnych group_duration_short i group_duration_long (podanych w tej kolejności), aby utworzyć dwie nowe, wymieszane populacje.
  • Przepróbkuj przetasowane populacje i odejmij resample_short od resample_long, aby obliczyć nową wartość test_statistic_shuffled.
  • Użyj plot_test_statistic(), aby zwizualizować oba rozkłady statystyk testowych i porównaj je wzrokowo.