Crie um modelo de regressão logística
Você já criou um modelo de árvore de decisão usando os dados dos voos. Agora você vai criar um modelo de Regressão Logística com os mesmos dados.
O objetivo é prever se um voo provavelmente vai atrasar pelo menos 15 minutos (rótulo 1
) ou não (rótulo 0
).
Mesmo tendo vários indicadores à sua disposição, por enquanto você só vai usar as colunas “ mon
”, “ depart
” e “ duration
”. São características numéricas que podem ser usadas direto num modelo de Regressão Logística. Você vai precisar fazer um pouco mais de trabalho antes de poder incluir características categóricas. Fica ligado!
Os dados foram divididos em conjuntos de treinamento e teste e estão disponíveis em flights_train
e flights_test
.
Este exercício faz parte do curso
Machine Learning com PySpark
Instruções do exercício
- Importa a classe pra criar um classificador de Regressão Logística.
- Crie um objeto classificador e treine-o com os dados de treinamento.
- Faça previsões para os dados de teste e crie uma matriz de confusão.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Import the logistic regression class
from pyspark.ml.____ import ____
# Create a classifier object and train on training data
logistic = ____().____(____)
# Create predictions for the testing data and show confusion matrix
prediction = ____.____(____)
prediction.groupBy(____, ____).____().show()