IniziaInizia gratis

Comprensione delle liste per dati con data e ora

Ora userai quello che hai imparato in questo capitolo per risolvere un semplice problema di estrazione dei dati. In questo esercizio ti verrà anche presentata una struttura dati, la serie pandas. Non ci dilungheremo troppo qui, ma quello che devi sapere è che si tratta di una struttura dati con cui lavorerai spesso quando analizzerai i dati dei DataFrame di pandas. Puoi pensare alle colonne di DataFrame come a degli array monodimensionali chiamati Serie.

In questo esercizio userai una comprensione di lista per estrarre l'ora dai dati Twitter con indicazione dell'ora. Il pacchetto pandas è stato importato come pd e il file 'tweets.csv' è stato importato come DataFrame df, pronto per essere usato.

Questo esercizio fa parte del corso

Strumenti per Python

Visualizza il corso

Istruzioni dell'esercizio

  • Estrai la colonna " 'created_at' " da " df " e metti il risultato in " tweet_time". Curiosità: la colonna estratta in tweet_time qui è una struttura dati di tipo Series!
  • Crea una lista che prenda l'ora da ogni riga in tweet_time. Ogni riga è una stringa che rappresenta un timestamp, e dovrai accedere ai caratteri dal 12° al 19° della stringa per estrarre l'ora. Usa entry come variabile iteratore e metti il risultato in tweet_clock_time. Ricorda che Python usa l'indicizzazione basata su 0!

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Extract the created_at column from df: tweet_time
tweet_time = ____

# Extract the clock time: tweet_clock_time
tweet_clock_time = [____]

# Print the extracted times
print(tweet_clock_time)
Modifica ed esegui il codice