Comece agoraComece grátis

Informação mútua entre variáveis

O data frame credit_df contém várias variáveis contínuas. Quando duas variáveis contínuas são correlacionadas, elas carregam a mesma informação — algo chamado de informação mútua. Variáveis altamente correlacionadas não são apenas redundantes; elas podem causar problemas na modelagem. Por exemplo, em regressão, variáveis altamente correlacionadas (isto é, multicolinearidade) podem gerar resultados sem sentido. Para ter uma noção da informação mútua, você vai criar um gráfico de correlação para identificar variáveis com informação mútua.

Os pacotes tidyverse e corrr já foram carregados para você.

Este exercicio faz parte do curso

Redução de Dimensionalidade em R

Ver curso

Instruções do exercicio

  • Use correlate() e rplot() para criar um gráfico de correlação das variáveis numéricas de credit_df.

exercicio interativo prático

Tente este exercicio completando este código de exemplo.

# Create a correlation plot
___ %>% 
  select(where(is.numeric)) %>% 
  ___() %>% 
  shave() %>% 
  ___(print_cor = TRUE) +
  theme(axis.text.x = element_text(angle = 90, hjust = 1))
Editar e Executar Código