Het verschil visualiseren
Voordat je hypothesetests gaat uitvoeren, is het slim om eerst wat verkennende data-analyse te doen: samenvattende statistieken berekenen en verdelingen visualiseren.
Hier kijk je naar het aandeel county-stemmen voor de Democratische kandidaat in 2012 en 2016, sample_dem_data. Omdat het om dezelfde counties in beide jaren gaat, zijn deze steekproeven gepaard. De kolommen met de steekproeven zijn dem_percent_12 en dem_percent_16.
dem_votes_potus_12_16 is beschikbaar als sample_dem_data. pandas en matplotlib.pyplot zijn geladen met hun gebruikelijke aliassen.
Deze oefening maakt deel uit van de cursus
Hypothesetoetsen in Python
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Calculate the differences from 2012 to 2016
sample_dem_data['diff'] = ____
# Print sample_dem_data
print(sample_dem_data)