Comprensione delle liste per dati con data e ora
Ora userai quello che hai imparato in questo capitolo per risolvere un semplice problema di estrazione dei dati. In questo esercizio ti verrà anche presentata una struttura dati, la serie pandas. Non ci dilungheremo troppo qui, ma quello che devi sapere è che si tratta di una struttura dati con cui lavorerai spesso quando analizzerai i dati dei DataFrame di pandas. Puoi pensare alle colonne di DataFrame come a degli array monodimensionali chiamati Serie.
In questo esercizio userai una comprensione di lista per estrarre l'ora dai dati Twitter con indicazione dell'ora. Il pacchetto pandas è stato importato come pd e il file 'tweets.csv' è stato importato come DataFrame df, pronto per essere usato.
Questo esercizio fa parte del corso
Strumenti per Python
Istruzioni dell'esercizio
- Estrai la colonna "
'created_at'" da "df" e metti il risultato in "tweet_time". Curiosità: la colonna estratta intweet_timequi è una struttura dati di tipo Series! - Crea una lista che prenda l'ora da ogni riga in
tweet_time. Ogni riga è una stringa che rappresenta un timestamp, e dovrai accedere ai caratteri dal 12° al 19° della stringa per estrarre l'ora. Usaentrycome variabile iteratore e metti il risultato intweet_clock_time. Ricorda che Python usa l'indicizzazione basata su 0!
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Extract the created_at column from df: tweet_time
tweet_time = ____
# Extract the clock time: tweet_clock_time
tweet_clock_time = [____]
# Print the extracted times
print(tweet_clock_time)