Construye un árbol de decisión
Ahora que has dividido los datos de los vuelos en conjuntos de entrenamiento y prueba, puedes utilizar el conjunto de entrenamiento para ajustar un modelo de árbol de decisión.
Los datos están disponibles en flights_train
y flights_test
.
NOTA: El modelo tardará unos segundos en entrenarse… ¡Ten paciencia!
Este ejercicio forma parte del curso
Machine learning con PySpark
Instrucciones del ejercicio
- Importa la clase para crear un clasificador de árbol de decisión.
- Crea un objeto clasificador y ajústalo a los datos de entrenamiento.
- Realiza predicciones para los datos de prueba y echa un vistazo a los resultados.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Import the Decision Tree Classifier class
from pyspark.ml.____ import ____
# Create a classifier object and fit to the training data
tree = ____()
tree_model = tree.____(____)
# Create predictions for the testing data and take a look at the predictions
prediction = tree_model.____(____)
prediction.select('label', 'prediction', 'probability').show(5, False)