Construye un árbol de decisiones
Ahora que has dividido los datos de los vuelos en conjuntos de entrenamiento y de prueba, puedes utilizar el conjunto de entrenamiento para ajustar un modelo de Árbol de Decisión.
Los datos están disponibles en flights_train
y flights_test
.
NOTA: El modelo tardará unos segundos en entrenarse… ¡ten paciencia!
Este ejercicio forma parte del curso
Machine learning con PySpark
Instrucciones de ejercicio
- Importa la clase para crear un clasificador de Árbol de Decisión.
- Crea un objeto clasificador y ajústalo a los datos de entrenamiento.
- Haz predicciones para los datos de la prueba y echa un vistazo a las predicciones.
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# Import the Decision Tree Classifier class
from pyspark.ml.____ import ____
# Create a classifier object and fit to the training data
tree = ____()
tree_model = tree.____(____)
# Create predictions for the testing data and take a look at the predictions
prediction = tree_model.____(____)
prediction.select('label', 'prediction', 'probability').show(5, False)