CommencerCommencer gratuitement

Comparer des médianes

Les tests paramétriques comparent généralement les moyennes, tandis que les tests non paramétriques comparent plutôt les médianes. En effet, si vos données sont asymétriques, la moyenne peut être un mauvais indicateur de tendance centrale, et il vaut mieux utiliser la médiane.

Chacune des organisations de classement universitaire que vous venez de voir fournit également un « total score » pour chaque université. Vous allez commencer par vérifier si les scores suivent approximativement une loi normale à l’aide d’un histogramme. Si ce n’est pas le cas, vous effectuerez un test de la médiane de Mood pour comparer leurs médianes. Dans cet exercice, vous travaillerez avec les classements universitaires CW et ARW.

Comme précédemment, même s’il existe plusieurs façons de créer des histogrammes, vous vous entraînerez à utiliser la méthode .hist().

Un DataFrame contenant ces trois jeux de classements se trouve dans rankings_df. Les packages pandas sous pd, NumPy sous np, Matplotlib.pyplot sous plt, et le package stats de SciPy ont tous été importés pour vous.

Cet exercice fait partie du cours

Fondements de l’inférence en Python

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Plot a histogram of the CW total score
rankings_df['cw_score'].____
plt.show()
Modifier et exécuter le code