1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Čištění dat v Pythonu

Connected

Cvičení

Přemapování kategorií

Abys lépe porozuměl/a respondentům průzkumu z datasetu airlines, chceš zjistit, jestli existuje vztah mezi některými odpověďmi a dnem v týdnu či čekací dobou u brány.

DataFrame airlines obsahuje sloupce day a wait_min, které jsou kategorické, resp. numerické. Sloupec day obsahuje přesný den, kdy let proběhl, a wait_min udává počet minut, které cestující čekali u brány. Pro snazší analýzu chceš vytvořit dvě nové kategorické proměnné:

  • wait_type: 'short' pro 0–60 min, 'medium' pro 60–180 min a long pro 180+
  • day_week: 'weekday' pokud den připadá na pracovní den, 'weekend' pokud připadá na víkend.

Balíčky pandas a numpy jsou importované jako pd a np. Pojďme vytvořit nová kategorická data!

Pokyny

100 XP
  • Vytvoř rozsahy a popisky pro sloupec wait_type podle popisu zadání.
  • Vytvoř sloupec wait_type ze sloupce wait_min pomocí pd.cut() – jako argumenty předej label_ranges a label_names na správná místa.
  • Vytvoř slovník mapping, který mapuje pracovní dny na 'weekday' a víkendové dny na 'weekend'.
  • Vytvoř sloupec day_week pomocí .replace().