Mediaanwaarden vergelijken
Parametrische toetsen vergelijken meestal gemiddelden, terwijl niet-parametrische toetsen meestal medianen vergelijken. Als je data scheef verdeeld is, is het gemiddelde vaak geen goede maat voor het centrum, en werk je beter met de mediaan.
Elke ranglijstorganisatie die je zojuist bekeek, gaf ook een "totaalscore" per universiteit. Je begint met controleren of de scores ongeveer normaal verdeeld zijn met een histogram. Als dat niet zo is, voer je een Mood's median test uit om hun medianen te vergelijken. In deze oefening werk je met de CW- en ARW-universiteitsranglijsten.
Er zijn meerdere manieren om histogrammen te maken, maar je oefent opnieuw met de .hist()-methode zoals hiervoor.
Een DataFrame met deze drie ranglijsten staat in rankings_df. De pakketten pandas als pd, NumPy als np, Matplotlib.pyplot als plt, en het stats-pakket uit SciPy zijn al voor je geïmporteerd.
Deze oefening maakt deel uit van de cursus
Basis van inferentie in Python
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Plot a histogram of the CW total score
rankings_df['cw_score'].____
plt.show()