Analizzare le colonne datetime
La feature engineering è un passaggio importante in tutti i workflow di Machine Learning per elaborare caratteristiche provenienti da tipi di dati diversi. In particolare, le colonne datetime sono comuni in molti insiemi di dati. In questo esercizio esplorerai la colonna hour del dataset, che è memorizzata come intero ma rappresenta un datetime. Per prima cosa effettuerai il parsing della colonna hour per convertirla in una colonna datetime. Poi estrarrai l'ora del giorno da quella colonna datetime e calcolerai il numero totale di clic in base a quell'ora del giorno.
Il modulo pandas è disponibile come pd nel tuo workspace e il DataFrame di esempio è caricato come df.
Questo esercizio fa parte del corso
Prevedere il CTR con il Machine Learning in Python
Istruzioni dell'esercizio
- Converti la colonna
hourda intero a colonnadatetimeusandopd.to_datetime(). - Usando l'accessor datetime
.dt, estrai il campo hour dalla colonna convertita con.hour. - Calcola i clic totali in base all'ora del giorno estratta usando
.sum().
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Change the hour column to a datetime and extract hour of day
df['hour'] = pd.____(df['hour'], format = '%y%m%d%H')
df['hour_of_day'] = df['hour'].____.____
print(df.head(5))
# Get and plot total clicks by hour of day
df.____('hour_of_day')['click'].____.plot.bar(figsize=(12,6))
plt.ylabel('Number of clicks')
plt.title('Number of clicks by hour of day')
plt.show()