1. Learn
  2. /
  3. Kurser
  4. /
  5. Hypotestestning i Python

Connected

övning

Använda ttest()

Att manuellt beräkna teststatistikor och omvandla dem med en CDF för att få ett p-värde är ganska omständligt när man vill jämföra två sampelmedelvärden. En sådan jämförelse kallas ett t-test, och Python-paketet pingouin har en .ttest()-metod som gör jobbet åt dig. Metoden erbjuder också viss flexibilitet i hur testet utförs.

Precis som i den föregående övningen ska du undersöka skillnaden i andelen röster för det demokratiska partiet på countynivå mellan 2012 och 2016, för att avgöra om skillnaden är statistiskt signifikant. Hypoteserna är följande:

\(H_{0}\): Andelen demokratiska röster var densamma 2012 och 2016. \(H_{A}\): Andelen demokratiska röster skilde sig åt mellan 2012 och 2016.

sample_dem_data finns tillgänglig med kolumnerna diff, dem_percent_12 och dem_percent_16, samt state och county. pingouin och pandas (som pd) är redan importerade.

Instruktioner 1/4

undefined XP
    1
    2
    3
    4
  • Genomför ett t-test på sampelskillnaderna (kolumnen diff i sample_dem_data), och välj en lämplig alternativhypotes bland "two-sided", "less" och "greater".