Gib eine 5-Punkte-Zusammenfassung aus
Eine der schnellsten Methoden, um ein Gefühl für neue Daten zu bekommen, ist die 5-Punkte-Zusammenfassung. Sie gibt 5 Kennzahlen einer Verteilung aus – Minimum, 25. Perzentil, Median, 75. Perzentil und Maximum – sowie Mittelwert und Standardabweichung. Wenn du dir die 5-Punkte-Zusammenfassung und den Unterschied zwischen Mittelwert und Minimal-/Maximalwerten ansiehst, bekommst du eine grobe Idee, ob Ausreißer in der Verteilung vorhanden sind.
In den Übungen dieses Kapitels verwendest du die in den Videos besprochenen Methoden, um die Preise der teuersten (oder günstigsten) US-Airbnb-Angebote zu erkennen. Der Datensatz wurde als airbnb_df als pandas-DataFrame geladen.
Diese Übung ist Teil des Kurses
Anomalieerkennung mit Python
Anleitung zur Übung
- Extrahiere die Spalte
priceaus den US-Airbnb-Angebotsdaten inprices. - Gib die 5-Punkte-Zusammenfassung der Verteilung
pricesaus.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Extract price
prices = ____
# Print 5-number summary
print(prices.____)