Un premier modèle de CTR
Dans cet exercice, vous allez construire un premier modèle de CTR sur le jeu de données Avazu en utilisant un arbre de décision et évaluer la précision du modèle avec accuracy_score() de sklearn. Vous utiliserez également train_test_split() de sklearn pour séparer les données d’entraînement et de test, au lieu de définir manuellement un point de coupure comme précédemment.
Dans votre espace de travail, des données d’exemple sous forme de DataFrame sont chargées dans df, ainsi que sklearn et pandas sous pd.
Nous allons effectuer une séparation simple entraînement/test et évaluer nos résultats à l’aide de la précision.
Cet exercice fait partie du cours
Prédire le CTR avec le Machine Learning en Python
Instructions
- Définissez
Xetycomme les variables explicatives et la cible respectivement, à partir de la colonneclick. - Séparez les données en ensembles d’entraînement et de test avec
train_test_split(X, y). - Créez un classificateur par arbre de décision.
- Générez des prédictions avec ce classificateur et évaluez la précision de ses prédictions.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Define X and y
X = df.____[:, ~df.columns.____(['click'])]
y = df.click
# Define training and testing
X_train, X_test, y_train, y_test = \
____(____, _____, test_size = .2, random_state = 0)
# Create decision tree classifier
clf = ____()
# Train classifier - predict label and evaluate accuracy
y_pred = clf.fit(____, _____).____(X_test)
print(____(y_test, y_pred))