Comparer des médianes
Les tests paramétriques comparent généralement les moyennes, tandis que les tests non paramétriques comparent plutôt les médianes. En effet, si vos données sont asymétriques, la moyenne peut être un mauvais indicateur de tendance centrale, et il vaut mieux utiliser la médiane.
Chacune des organisations de classement universitaire que vous venez de voir fournit également un « total score » pour chaque université. Vous allez commencer par vérifier si les scores suivent approximativement une loi normale à l’aide d’un histogramme. Si ce n’est pas le cas, vous effectuerez un test de la médiane de Mood pour comparer leurs médianes. Dans cet exercice, vous travaillerez avec les classements universitaires CW et ARW.
Comme précédemment, même s’il existe plusieurs façons de créer des histogrammes, vous vous entraînerez à utiliser la méthode .hist().
Un DataFrame contenant ces trois jeux de classements se trouve dans rankings_df. Les packages pandas sous pd, NumPy sous np, Matplotlib.pyplot sous plt, et le package stats de SciPy ont tous été importés pour vous.
Cet exercice fait partie du cours
Fondements de l’inférence en Python
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Plot a histogram of the CW total score
rankings_df['cw_score'].____
plt.show()