Criar uma árvore de decisão
Agora que você dividiu os dados dos voos em conjuntos de treinamento e teste, pode usar o conjunto de treinamento para ajustar um modelo de árvore de decisão.
Os dados estão disponíveis em flights_train e flights_test.
OBSERVE: O modelo levará alguns segundos para ser treinado… seja paciente!
Este exercício faz parte do curso
Machine learning com PySpark
Instruções do exercício
- Importe a classe para criar um classificador de árvore de decisão.
- Crie um objeto classificador e ajuste-o aos dados de treinamento.
- Faça previsões para os dados de teste e dê uma olhada nas previsões.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Import the Decision Tree Classifier class
from pyspark.ml.____ import ____
# Create a classifier object and fit to the training data
tree = ____()
tree_model = tree.____(____)
# Create predictions for the testing data and take a look at the predictions
prediction = tree_model.____(____)
prediction.select('label', 'prediction', 'probability').show(5, False)