Un primo modello di CTR
In questo esercizio costruirai un primo modello di CTR sul dataset Avazu usando un albero di decisione e valuterai l’accuratezza del modello con accuracy_score() di sklearn. Inoltre, userai train_test_split() di sklearn per suddividere i dati di training e di test invece di definire manualmente un punto di split come fatto prima.
Nel tuo workspace, i dati di esempio in formato DataFrame sono caricati come df, insieme a sklearn e pandas come pd.
Eseguiremo una semplice suddivisione tra training e test e valuteremo i risultati usando l’accuratezza.
Questo esercizio fa parte del corso
Prevedere il CTR con il Machine Learning in Python
Istruzioni dell'esercizio
- Definisci
Xeycome feature e target rispettivamente, basandoti sulla colonnaclick. - Suddividi i dati in insiemi di training e di test usando
train_test_split(X, y). - Crea un classificatore ad albero di decisione.
- Genera le previsioni usando il classificatore e valuta l’accuratezza delle sue previsioni.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Define X and y
X = df.____[:, ~df.columns.____(['click'])]
y = df.click
# Define training and testing
X_train, X_test, y_train, y_test = \
____(____, _____, test_size = .2, random_state = 0)
# Create decision tree classifier
clf = ____()
# Train classifier - predict label and evaluate accuracy
y_pred = clf.fit(____, _____).____(X_test)
print(____(y_test, y_pred))