IniziaInizia gratis

Primi passi

In questo esercizio, darai un'occhiata rapida a un campione di dati usando alcune operazioni di base sui DataFrame e facendo una prima esplorazione del CTR. I dati provengono da Avazu, una delle principali piattaforme pubblicitarie globali, e catturano le interazioni degli utenti su vari tipi di dispositivo per diversi siti web e app.

La variabile target si trova nella colonna click. L'ora è nel formato YYMMDDHH, e ci sono alcune colonne intere: device_type per il tipo di dispositivo, banner_pos per la posizione di un banner ad (chiamato anche display ad), ecc. Ci saranno anche altre variabili di cui parleremo nei capitoli successivi.

Un campione di dati in forma di DataFrame è caricato come df. pandas come pd è disponibile nel tuo workspace.

Questo esercizio fa parte del corso

Prevedere il CTR con il Machine Learning in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Definisci la variabile X usando .isin(). X conterrà tutte le colonne tranne la colonna click.
  • Definisci la variabile y, a cui puoi accedere con df.click.
  • Stampa la proporzione di righe di y uguali a 1 — rappresenta il CTR del campione — usando y.sum().

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Look at basics of Dataframe 
print(df.head(5))
print(df.columns)

# Define X and y
X = df.____[:, ~df.columns.____(['click'])]
y = df.____

# Sample CTR
print("Sample CTR :\n", 
      y.____/len(y))
Modifica ed esegui il codice