Primi passi
In questo esercizio, darai un'occhiata rapida a un campione di dati usando alcune operazioni di base sui DataFrame e facendo una prima esplorazione del CTR. I dati provengono da Avazu, una delle principali piattaforme pubblicitarie globali, e catturano le interazioni degli utenti su vari tipi di dispositivo per diversi siti web e app.
La variabile target si trova nella colonna click. L'ora è nel formato YYMMDDHH, e ci sono alcune colonne intere: device_type per il tipo di dispositivo, banner_pos per la posizione di un banner ad (chiamato anche display ad), ecc. Ci saranno anche altre variabili di cui parleremo nei capitoli successivi.
Un campione di dati in forma di DataFrame è caricato come df. pandas come pd è disponibile nel tuo workspace.
Questo esercizio fa parte del corso
Prevedere il CTR con il Machine Learning in Python
Istruzioni dell'esercizio
- Definisci la variabile
Xusando.isin().Xconterrà tutte le colonne tranne la colonnaclick. - Definisci la variabile
y, a cui puoi accedere condf.click. - Stampa la proporzione di righe di
yuguali a1— rappresenta il CTR del campione — usandoy.sum().
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Look at basics of Dataframe
print(df.head(5))
print(df.columns)
# Define X and y
X = df.____[:, ~df.columns.____(['click'])]
y = df.____
# Sample CTR
print("Sample CTR :\n",
y.____/len(y))