Medianwerte vergleichen
Parametrische Tests vergleichen meist Mittelwerte, nichtparametrische Tests dagegen oft Medianwerte. Der Grund: Wenn deine Daten schief verteilt sind, ist der Mittelwert kein guter Lageparameter – dann arbeitest du besser mit dem Median.
Jede der Uni-Ranglisten, die du dir eben angesehen hast, enthält auch einen "Gesamtscore" für jede Universität. Du startest damit, per Histogramm zu prüfen, ob die Scores ungefähr normalverteilt sind. Falls nicht, führst du einen Mood-Median-Test durch, um die Mediane zu vergleichen. In dieser Übung arbeitest du mit den CW- und ARW-Uni-Rankings.
Auch hier gibt es mehrere Wege, Histogramme zu erstellen. Du übst wie zuvor die .hist()-Methode.
Ein DataFrame mit diesen drei Ranglisten liegt in rankings_df vor. Die Pakete pandas als pd, NumPy als np, Matplotlib.pyplot als plt und das stats-Paket aus SciPy wurden für dich geladen.
Diese Übung ist Teil des Kurses
Grundlagen der Inferenz in Python
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Plot a histogram of the CW total score
rankings_df['cw_score'].____
plt.show()