Gib eine 5-Punkte-Zusammenfassung aus
Eine der schnellsten Methoden, um ein Gefühl für neue Daten zu bekommen, ist die 5-Punkte-Zusammenfassung. Sie gibt 5 Kennzahlen einer Verteilung aus – Minimum, 25. Perzentil, Median, 75. Perzentil und Maximum – sowie Mittelwert und Standardabweichung. Wenn du dir die 5-Punkte-Zusammenfassung und den Unterschied zwischen Mittelwert und Minimal-/Maximalwerten ansiehst, bekommst du eine grobe Idee, ob Ausreißer in der Verteilung vorhanden sind.
In den Übungen dieses Kapitels verwendest du die in den Videos besprochenen Methoden, um die Preise der teuersten (oder günstigsten) US-Airbnb-Angebote zu erkennen. Der Datensatz wurde als airbnb_df als pandas-DataFrame geladen.
Diese Übung ist Teil des Kurses
<Kurs>Anomalieerkennung mit Python</Kurs>Übungsanweisungen
- Extrahiere die Spalte
priceaus den US-Airbnb-Angebotsdaten inprices. - Gib die 5-Punkte-Zusammenfassung der Verteilung
pricesaus.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Extract price
prices = ____
# Print 5-number summary
print(prices.____)