1. Learn
  2. /
  3. Cursuri
  4. /
  5. Curățarea datelor în Python

Connected

exercițiu

Răspunsuri detaliate

Pentru a înțelege mai bine experiența călătorilor pe Aeroportul San Francisco, departamentul de asigurare a calității a trimis un chestionar calitativ tuturor călătorilor care au acordat aeroportului cele mai mici scoruri posibile la toate categoriile. Scopul acestui chestionar este de a identifica tipare comune în ceea ce spun călătorii despre aeroport.

Răspunsurile lor sunt stocate în coloana survey_response. Analizând datele mai atent, ai observat că unele răspunsuri conțin numărul minim de caractere, fără prea mult conținut. În acest exercițiu, vei izola răspunsurile cu un număr de caractere mai mare de 40 și vei verifica că noul tău DataFrame conține răspunsuri cu cel puțin 40 de caractere, folosind o instrucțiune assert.

DataFrame-ul airlines este disponibil în mediul tău de lucru, iar pandas este importat ca pd.

Instrucțiuni

100 XP
  • Folosind DataFrame-ul airlines, stochează lungimea fiecărui răspuns din coloana survey_response în resp_length cu ajutorul .str.len().
  • Izolează rândurile din airlines pentru care resp_length este mai mare de 40.
  • Verifică prin assert că lungimea minimă a răspunsurilor din survey_response în airlines_survey este acum mai mare de 40.