Kategorien neu zuordnen
Um die Umfrageteilnehmer von airlines
besser zu verstehen, möchtest du herausfinden, ob es einen Zusammenhang zwischen bestimmten Antworten und dem Wochentag und der Wartezeit am Gate gibt.
Der DataFrame airlines
enthält die kategoriale Spalte day
und die numerische Spalte wait_min
. Die Spalte day
enthält den genauen Tag, an dem ein Flug stattfand, und wait_min
enthält die Anzahl der Minuten, die die Reisenden am Gate warten mussten. Um deine Analyse zu erleichtern, möchtest du zwei neue kategoriale Variablen erstellen:
wait_type
:'short'
für 0–60 Min.,'medium'
für 60–180 Min. undlong
für 180+ Min.day_week
:'weekday'
wenn der Tag ein Wochentag ist,'weekend'
wenn der Tag zum Wochenende gehört.
Die Pakete pandas
und numpy
wurden als pd
und np
importiert. Lass uns ein paar neue kategoriale Daten erstellen!
Diese Übung ist Teil des Kurses
Datenbereinigung in Python
Anleitung zur Übung
- Erstelle die Bereiche und Beschriftungen für die in der Beschreibung erwähnte Spalte
wait_type
. - Erstelle die Spalte
wait_type
vonwait_min
mitpd.cut()
, während dulabel_ranges
undlabel_names
in den richtigen Argumenten eingibst. - Erstelle das Dictionary
mapping
, das die Wochentage auf'weekday'
und die Wochenendtage auf'weekend'
abbildet. - Erstelle die Spalte
day_week
, indem du.replace()
verwendest.
Interaktive Übung zum Anfassen
Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.
# Create ranges for categories
label_ranges = [0, 60, ____, np.inf]
label_names = ['short', ____, ____]
# Create wait_type column
airlines['wait_type'] = pd.____(____, bins = ____,
labels = ____)
# Create mappings and replace
mappings = {'Monday':'weekday', 'Tuesday':'____', 'Wednesday': '____',
'Thursday': '____', '____': '____',
'Saturday': 'weekend', '____': '____'}
airlines['day_week'] = airlines['day'].____(mappings)