1. Learn
  2. /
  3. Cursuri
  4. /
  5. Curățarea datelor în Python

Connected

exercițiu

Găsirea inconsistențelor

În acest exercițiu și pe parcursul acestui capitol, vei lucra cu DataFrame-ul airlines, care conține răspunsurile la un sondaj despre Aeroportul San Francisco, colectate de la clienții companiilor aeriene.

DataFrame-ul conține metadate despre zboruri, precum compania aeriană, destinația, timpii de așteptare, dar și răspunsuri la întrebări-cheie despre curățenie, siguranță și satisfacție. A fost creat un al doilea DataFrame, numit categories, care conține toate valorile corecte posibile pentru coloanele din sondaj.

În acest exercițiu, vei folosi ambele DataFrame-uri pentru a identifica răspunsurile cu valori inconsistente și pentru a le elimina, realizând practic un outer join și un inner join pe cele două DataFrame-uri, așa cum ai văzut în videoclip. Pachetul pandas a fost importat ca pd, iar DataFrame-urile airlines și categories sunt disponibile în mediul tău de lucru.

Instrucțiuni 1/4

undefined XP
    1
    2
    3
    4
  • Afișează DataFrame-ul categories și analizează cu atenție toate categoriile corecte posibile pentru coloanele din sondaj.
  • Afișează valorile unice ale coloanelor din sondaj din airlines folosind metoda .unique().