Tu primer modelo de CTR
En este ejercicio, vas a construir tu primer modelo de CTR con el conjunto de datos de Avazu utilizando un árbol de decisión y evaluar la precisión del modelo con accuracy_score() de sklearn. Además, usarás train_test_split() de sklearn para dividir los datos de entrenamiento y prueba en lugar de definir manualmente un punto de corte como antes.
En tu espacio de trabajo, se han cargado datos de muestra en formato DataFrame como df, junto con sklearn y pandas como pd.
Haremos una división básica entre entrenamiento y prueba y evaluaremos los resultados usando la precisión.
Este ejercicio forma parte del curso
Predicción del CTR con Machine Learning en Python
Instrucciones del ejercicio
- Define
Xyycomo las características y el objetivo respectivamente, basándote en la columnaclick. - Divide los datos en conjuntos de entrenamiento y prueba usando
train_test_split(X, y). - Crea un clasificador de árbol de decisión.
- Genera predicciones con el clasificador y evalúa la precisión de sus predicciones.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Define X and y
X = df.____[:, ~df.columns.____(['click'])]
y = df.click
# Define training and testing
X_train, X_test, y_train, y_test = \
____(____, _____, test_size = .2, random_state = 0)
# Create decision tree classifier
clf = ____()
# Train classifier - predict label and evaluate accuracy
y_pred = clf.fit(____, _____).____(X_test)
print(____(y_test, y_pred))