Somma di stringhe e concatenazione di numeri
Nell'esercizio precedente hai individuato che category è il tipo di dato corretto per user_type e l'hai convertito per poter estrarre riepiloghi statistici rilevanti che fanno luce sulla distribuzione di user_type.
Un altro problema comune con i tipi di dato è importare come stringhe valori che dovrebbero essere numerici, perché operazioni matematiche come somma e moltiplicazione portano alla concatenazione di stringhe, non a risultati numerici.
In questo esercizio convertirai la colonna di stringhe duration nel tipo int. Prima, però, devi rimuovere "minutes" dalla colonna per fare in modo che pandas la interpreti come numerica. Il pacchetto pandas è stato importato come pd.
Questo esercizio fa parte del corso
Pulizia dei dati in Python
Istruzioni dell'esercizio
- Usa il metodo
.strip()per rimuovere"minutes"daduratione salva il risultato nella colonnaduration_trim. - Converte
duration_trimininte salva il risultato nella colonnaduration_time. - Scrivi un'istruzione
assertche verifichi che il tipo di dato diduration_timesia ora unint. - Stampa la durata media del viaggio.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Strip duration of minutes
ride_sharing['duration_trim'] = ride_sharing['duration'].____.____()
# Convert duration to integer
ride_sharing['duration_time'] = ____
# Write an assert statement making sure of conversion
assert ride_sharing['____'].____ == '____'
# Print formed columns and calculate average ride duration
print(ride_sharing[['duration','duration_trim','duration_time']])
print(____)