IniziaInizia gratis

Analizzare le colonne datetime

La feature engineering è un passaggio importante in tutti i workflow di Machine Learning per elaborare caratteristiche provenienti da tipi di dati diversi. In particolare, le colonne datetime sono comuni in molti insiemi di dati. In questo esercizio esplorerai la colonna hour del dataset, che è memorizzata come intero ma rappresenta un datetime. Per prima cosa effettuerai il parsing della colonna hour per convertirla in una colonna datetime. Poi estrarrai l'ora del giorno da quella colonna datetime e calcolerai il numero totale di clic in base a quell'ora del giorno.

Il modulo pandas è disponibile come pd nel tuo workspace e il DataFrame di esempio è caricato come df.

Questo esercizio fa parte del corso

Prevedere il CTR con il Machine Learning in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Converti la colonna hour da intero a colonna datetime usando pd.to_datetime().
  • Usando l'accessor datetime .dt, estrai il campo hour dalla colonna convertita con .hour.
  • Calcola i clic totali in base all'ora del giorno estratta usando .sum().

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Change the hour column to a datetime and extract hour of day
df['hour'] = pd.____(df['hour'], format = '%y%m%d%H')
df['hour_of_day'] = df['hour'].____.____
print(df.head(5))

# Get and plot total clicks by hour of day
df.____('hour_of_day')['click'].____.plot.bar(figsize=(12,6))
plt.ylabel('Number of clicks')
plt.title('Number of clicks by hour of day')
plt.show()
Modifica ed esegui il codice