Die Varianz berechnen
Es ist wichtig, ein Grundverständnis davon zu haben, was häufig verwendete Funktionen intern machen. Auch wenn du vielleicht schon weißt, wie man Varianzen berechnet, ist dies ein Anfängerkurs und setzt das nicht voraus. In dieser Übung berechnen wir die Varianz der Blütenblattlänge von Iris veriscolor explizit mithilfe der in den Videos besprochenen Gleichungen. Anschließend verwenden wir np.var(), um sie zu berechnen.
Diese Übung ist Teil des Kurses
Statistical Thinking in Python (Teil 1)
Anleitung zur Übung
- Erstelle ein Array namens
differences, das die Differenz zwischen den Blütenblattlängen (versicolor_petal_length) und der mittleren Blütenblattlänge enthält. Die Variableversicolor_petal_lengthist bereits als NumPy-Array in deinem Namespace, sodass du die vektorisierten Operationen von NumPy nutzen kannst. - Quadriere jedes Element in diesem Array. Zum Beispiel quadriert
x**2jedes Element im Arrayx. Speichere das Ergebnis alsdiff_sq. - Berechne den Mittelwert der Elemente in
diff_sqmitnp.mean(). Speichere das Ergebnis alsvariance_explicit. - Berechne die Varianz von
versicolor_petal_lengthmitnp.var(). Speichere das Ergebnis alsvariance_np. - Gib sowohl
variance_explicitals auchvariance_npin einemprint-Aufruf aus, um sicherzustellen, dass sie übereinstimmen.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Array of differences to mean: differences
# Square the differences: diff_sq
# Compute the mean square difference: variance_explicit
# Compute the variance using NumPy: variance_np
# Print the results