Criar uma árvore de decisão
Agora que você dividiu os dados dos voos em conjuntos de treinamento e teste, pode usar o conjunto de treinamento para ajustar um modelo de árvore de decisão.
Os dados estão disponíveis em flights_train
e flights_test
.
NOTE: Levará alguns segundos para que o modelo seja treinado… seja paciente!
Este exercício faz parte do curso
Aprendizado de máquina com PySpark
Instruções de exercício
- Importe a classe para criar um classificador de árvore de decisão.
- Crie um objeto classificador e ajuste-o aos dados de treinamento.
- Faça previsões para os dados de teste e dê uma olhada nas previsões.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Import the Decision Tree Classifier class
from pyspark.ml.____ import ____
# Create a classifier object and fit to the training data
tree = ____()
tree_model = tree.____(____)
# Create predictions for the testing data and take a look at the predictions
prediction = tree_model.____(____)
prediction.select('label', 'prediction', 'probability').show(5, False)