Kategorien für die Flugdauer
Wie du gesehen hast, gibt es 362 eindeutige Werte in der Spalte "Duration"
von planes
. Wenn wir planes["Duration"].head()
aufrufen, sehen wir die folgenden Werte:
0 19h
1 5h 25m
2 4h 45m
3 2h 25m
4 15h 30m
Name: Duration, dtype: object
Sieht so aus, als wird es nicht so einfach sein, das in Zahlen umzuwandeln. Du könntest die Flüge aber auch nach Dauer kategorisieren und die Häufigkeit der verschiedenen Fluglängen untersuchen.
Du erstellst eine Spalte namens "Duration_Category"
im DataFrame planes
. Bevor du dies tun kannst, musst du eine Liste der Werte erstellen, die du in den DataFrame einfügen möchtest, gefolgt von den vorhandenen Werten, anhand derer sie berechnet werden sollen.
Diese Übung ist Teil des Kurses
Explorative Datenanalyse in Python
Interaktive Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Create a list of categories
flight_categories = ____