ComeçarComece de graça

Variáveis correlacionadas

Neste exercício, você vai inspecionar o conjunto de dados quanto à presença de variáveis correlacionadas. É importante removê-las antes de aplicar um classificador binário, especialmente no caso de regressão logística. Quando duas ou mais variáveis estão altamente correlacionadas, você deve manter apenas uma e remover as demais.

Primeiro, usaremos a função corrplot() do pacote corrplot para visualizar as correlações. No gráfico de correlação, azul representa correlação positiva e vermelho, correlação negativa. Uma cor mais escura indica correlação mais forte. Por fim, você vai remover do conjunto de dados as variáveis altamente correlacionadas.

Este exercício faz parte do curso

Análise Preditiva com Dados em Rede em R

Ver curso

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Remove the Future column from studentnetworkdata 
no_future <- ___

# Load the corrplot package
library(___)

# Generate the correlation matrix
M <- ___(no_future)

# Plot the correlations
___(M, method = "circle")
Editar e executar o código