ComeçarComece de graça

Verificando recursos correlacionados

Agora você vai voltar ao conjunto de dados wine, que contém recursos numéricos contínuos. Execute o coeficiente de correlação de Pearson no conjunto de dados para determinar quais colunas são boas candidatas à eliminação. Em seguida, remova essas colunas do DataFrame.

Este exercício faz parte do curso

Pré-processamento para Machine Learning em Python

Ver curso

Instruções do exercício

  • Imprima os coeficientes de correlação de Pearson para cada par de recursos no conjunto de dados wine.
  • Remova quaisquer colunas de wine que tenham coeficiente de correlação acima de 0,75 com pelo menos outras duas colunas.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Print out the column correlations of the wine dataset
print(____)

# Drop that column from the DataFrame
wine = wine.____(____, ____)

print(wine.head())
Editar e executar o código