De variantie berekenen
Het is belangrijk om enig begrip te hebben van wat veelgebruikte functies onder de motorkap doen. Ook al weet je misschien al hoe je varianties moet berekenen, dit is een beginnerscursus waarin we dat niet aannemen. In deze oefening berekenen we expliciet de variantie van de kroonbladlengte van Iris veriscolor met behulp van de formules die in de video's zijn besproken. Daarna gebruiken we np.var() om het te berekenen.
Deze oefening maakt deel uit van de cursus
Statistisch denken in Python (deel 1)
Oefeninstructies
- Maak een array
differencesdie het verschil is tussen de kroonbladlengtes (versicolor_petal_length) en de gemiddelde kroonbladlengte. De variabeleversicolor_petal_lengthstaat al in je namespace als een NumPy-array, dus je kunt gebruikmaken van de gevectoriseerde bewerkingen van NumPy. - Kwadrateer elk element in deze array. Bijvoorbeeld,
x**2kwadrateert elk element in de arrayx. Sla het resultaat op alsdiff_sq. - Bereken het gemiddelde van de elementen in
diff_sqmetnp.mean(). Sla het resultaat op alsvariance_explicit. - Bereken de variantie van
versicolor_petal_lengthmetnp.var(). Sla het resultaat op alsvariance_np. - Print zowel
variance_explicitalsvariance_npin éénprint-aanroep om te controleren of ze overeenkomen.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Array of differences to mean: differences
# Square the differences: diff_sq
# Compute the mean square difference: variance_explicit
# Compute the variance using NumPy: variance_np
# Print the results