1. Learn
  2. /
  3. Cursuri
  4. /
  5. Curățarea datelor în Python

Connected

exercițiu

Remaparea categoriilor

Pentru a înțelege mai bine respondenții sondajului din airlines, vrei să afli dacă există o relație între anumite răspunsuri și ziua din săptămână, respectiv timpul de așteptare la poartă.

DataFrame-ul airlines conține coloanele day și wait_min, care sunt categoriale, respectiv numerice. Coloana day conține ziua exactă în care a avut loc un zbor, iar wait_min conține numărul de minute pe care călătorii le-au așteptat la poartă. Pentru a-ți simplifica analiza, vrei să creezi două noi variabile categoriale:

  • wait_type: 'short' pentru 0-60 min, 'medium' pentru 60-180 și long pentru 180+
  • day_week: 'weekday' dacă ziua este în timpul săptămânii, 'weekend' dacă ziua este în weekend.

Pachetele pandas și numpy au fost importate ca pd și np. Hai să creăm niște date categoriale noi!

Instrucțiuni

100 XP
  • Creează intervalele și etichetele pentru coloana wait_type menționate în descriere.
  • Creează coloana wait_type din wait_min folosind pd.cut(), introducând label_ranges și label_names în argumentele corecte.
  • Creează dicționarul mapping care mapează zilele de săptămână la 'weekday' și zilele de weekend la 'weekend'.
  • Creează coloana day_week folosind .replace().