1. Learn
  2. /
  3. Cursuri
  4. /
  5. Curățarea datelor în Python

Connected

exercițiu

Adunarea șirurilor și concatenarea numerelor

În exercițiul anterior, ai identificat că category este tipul de date corect pentru user_type și l-ai convertit pentru a extrage rezumate statistice relevante, care să evidențieze distribuția valorilor din user_type.

O altă problemă frecventă legată de tipurile de date este importarea unor valori care ar trebui să fie numerice sub formă de șiruri de caractere. În acest caz, operații matematice precum adunarea sau înmulțirea duc la concatenarea șirurilor, nu la rezultate numerice.

În acest exercițiu, vei converti coloana de tip șir duration la tipul int. Înainte de asta, va trebui să elimini "minutes" din coloană, astfel încât pandas să o interpreteze ca valoare numerică. Pachetul pandas a fost importat ca pd.

Instrucțiuni

100 XP
  • Folosește metoda .strip() pentru a elimina "minutes" din coloana duration și stochează rezultatul în coloana duration_trim.
  • Convertește duration_trim la int și stochează rezultatul în coloana duration_time.
  • Scrie o instrucțiune assert care verifică dacă tipul de date al coloanei duration_time este acum int.
  • Afișează durata medie a călătoriei.