1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Testování hypotéz v Pythonu

Connected

cvičení

Použití ttest()

Ručně počítat testové statistiky a převádět je pomocí CDF na p-hodnotu je při porovnávání dvou výběrových průměrů dost pracné. Porovnání dvou výběrových průměrů se nazývá t-test a balíček pingouin nabízí metodu .ttest(), která to zvládne za tebe. Tato metoda ti dává určitou flexibilitu v tom, jak test provést.

Jako v předchozím cvičení prozkoumáš rozdíl mezi podílem hlasů pro demokratického kandidáta na úrovni okresů v letech 2012 a 2016, abys zjistil/a, zda je tento rozdíl statisticky významný. Hypotézy jsou následující:

\(H_{0}\): Podíl hlasů pro demokraty byl v letech 2012 a 2016 stejný. \(H_{A}\): Podíl hlasů pro demokraty byl v letech 2012 a 2016 různý.

K dispozici máš sample_dem_data se sloupci diff, dem_percent_12 a dem_percent_16, a také se sloupci názvů state a county. Balíček pingouin je načten spolu s pandas jako pd.

Pokyny 1/4

undefined XP
    1
    2
    3
    4
  • Proveď t-test na rozdílech ve vzorku (sloupec diff z sample_dem_data) a zvol vhodnou alternativní hypotézu z možností "two-sided", "less" a "greater".