Seu primeiro modelo de CTR
Neste exercício, você vai construir um primeiro modelo de CTR no conjunto de dados Avazu usando uma árvore de decisão e avaliar a acurácia do modelo com accuracy_score() do sklearn. Além disso, você usará train_test_split() do sklearn para dividir os dados de treino e teste, em vez de definir manualmente um ponto de divisão como antes.
No seu ambiente de trabalho, dados de exemplo em formato DataFrame estão carregados como df, e sklearn e pandas como pd.
Vamos fazer uma divisão básica entre treino e teste e avaliar nossos resultados usando acurácia.
Este exercício faz parte do curso
Prevendo CTR com Machine Learning em Python
Instruções do exercício
- Defina
Xeycomo features e target, respectivamente, com base na colunaclick. - Divida os dados em conjuntos de treino e teste usando
train_test_split(X, y). - Crie um classificador de árvore de decisão.
- Gere previsões usando o classificador e avalie a acurácia das previsões.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Define X and y
X = df.____[:, ~df.columns.____(['click'])]
y = df.click
# Define training and testing
X_train, X_test, y_train, y_test = \
____(____, _____, test_size = .2, random_state = 0)
# Create decision tree classifier
clf = ____()
# Train classifier - predict label and evaluate accuracy
y_pred = clf.fit(____, _____).____(X_test)
print(____(y_test, y_pred))