ComeçarComece de graça

Crie um modelo de regressão logística

Você já criou um modelo de árvore de decisão usando os dados dos voos. Agora você vai criar um modelo de Regressão Logística com os mesmos dados.

O objetivo é prever se um voo provavelmente vai atrasar pelo menos 15 minutos (rótulo 1) ou não (rótulo 0).

Mesmo tendo vários indicadores à sua disposição, por enquanto você só vai usar as colunas “ mon ”, “ depart ” e “ duration ”. São características numéricas que podem ser usadas direto num modelo de Regressão Logística. Você vai precisar fazer um pouco mais de trabalho antes de poder incluir características categóricas. Fica ligado!

Os dados foram divididos em conjuntos de treinamento e teste e estão disponíveis em flights_train e flights_test.

Este exercício faz parte do curso

Machine Learning com PySpark

Ver curso

Instruções do exercício

  • Importa a classe pra criar um classificador de Regressão Logística.
  • Crie um objeto classificador e treine-o com os dados de treinamento.
  • Faça previsões para os dados de teste e crie uma matriz de confusão.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Import the logistic regression class
from pyspark.ml.____ import ____

# Create a classifier object and train on training data
logistic = ____().____(____)

# Create predictions for the testing data and show confusion matrix
prediction = ____.____(____)
prediction.groupBy(____, ____).____().show()
Editar e executar o código