ECDF's vergelijken
Met ECDF's kun je ook twee of meer verdelingen vergelijken (al wordt de plot onoverzichtelijk als het er te veel zijn). Hier ga je ECDF's plotten voor de kelkbladlengtes van alle drie de iris-soorten. Je hebt al een functie geschreven om ECDF's te maken, dus die kun je nu goed gebruiken!
Om alle drie de ECDF's over elkaar te leggen in dezelfde plot, kun je plt.plot() drie keer gebruiken, één keer per ECDF. Vergeet niet om marker='.' en linestyle='none' als argumenten in plt.plot() mee te geven.
Deze oefening maakt deel uit van de cursus
Statistisch denken in Python (deel 1)
Oefeninstructies
- Bereken ECDF's voor elk van de drie soorten met je
ecdf()-functie. De variabelensetosa_petal_length,versicolor_petal_lengthenvirginica_petal_lengthstaan al in je namespace. Pak de ECDF's uit in respectievelijkx_set, y_set,x_vers, y_versenx_virg, y_virg. - Plot alle drie de ECDF's als punten in dezelfde plot. Hiervoor heb je drie
plt.plot()-commando's nodig. Ken het resultaat van elk toe aan_. - Er is al een legenda en aslabels voor je toegevoegd, dus klik op Verzenden om alle ECDF's te zien!
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Compute ECDFs
# Plot all ECDFs on the same plot
# Annotate the plot
plt.legend(('setosa', 'versicolor', 'virginica'), loc='lower right')
_ = plt.xlabel('petal length (cm)')
_ = plt.ylabel('ECDF')
# Display the plot
plt.show()