Erste SchritteKostenlos loslegen

Kategorien neu zuordnen

Um die Umfrageteilnehmer von airlines besser zu verstehen, möchtest du herausfinden, ob es einen Zusammenhang zwischen bestimmten Antworten und dem Wochentag und der Wartezeit am Gate gibt.

Der DataFrame airlines enthält die kategoriale Spalte day und die numerische Spalte wait_min. Die Spalte day enthält den genauen Tag, an dem ein Flug stattfand, und wait_min enthält die Anzahl der Minuten, die die Reisenden am Gate warten mussten. Um deine Analyse zu erleichtern, möchtest du zwei neue kategoriale Variablen erstellen:

  • wait_type: 'short' für 0–60 Min., 'medium' für 60–180 Min. und long für 180+ Min.
  • day_week: 'weekday' wenn der Tag ein Wochentag ist, 'weekend' wenn der Tag zum Wochenende gehört.

Die Pakete pandas und numpy wurden als pd und np importiert. Lass uns ein paar neue kategoriale Daten erstellen!

Diese Übung ist Teil des Kurses

Datenbereinigung in Python

Kurs anzeigen

Anleitung zur Übung

  • Erstelle die Bereiche und Beschriftungen für die in der Beschreibung erwähnte Spalte wait_type.
  • Erstelle die Spalte wait_type von wait_min mit pd.cut(), während du label_ranges und label_names in den richtigen Argumenten eingibst.
  • Erstelle das Dictionary mapping, das die Wochentage auf 'weekday' und die Wochenendtage auf 'weekend' abbildet.
  • Erstelle die Spalte day_week, indem du .replace() verwendest.

Interaktive Übung zum Anfassen

Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.

# Create ranges for categories
label_ranges = [0, 60, ____, np.inf]
label_names = ['short', ____, ____]

# Create wait_type column
airlines['wait_type'] = pd.____(____, bins = ____, 
                                labels = ____)

# Create mappings and replace
mappings = {'Monday':'weekday', 'Tuesday':'____', 'Wednesday': '____', 
            'Thursday': '____', '____': '____', 
            'Saturday': 'weekend', '____': '____'}

airlines['day_week'] = airlines['day'].____(mappings)
Bearbeiten und Ausführen von Code