1. Apprendre
  2. /
  3. Cours
  4. /
  5. Prétraitement pour le Machine Learning en Python

Connected

Exercice

Vérifier la corrélation entre les caractéristiques

Revenez maintenant à l'ensemble de données wine, qui contient des caractéristiques continues et numériques. Calculez le coefficient de corrélation de Pearson sur l'ensemble pour déterminer quelles colonnes sont de bonnes candidates à éliminer. Ensuite, retirez ces colonnes du DataFrame.

Instructions

100 XP
  • Affichez les coefficients de corrélation de Pearson pour chaque paire de caractéristiques dans l'ensemble de données wine.
  • Supprimez de wine toute colonne ayant un coefficient de corrélation supérieur à 0,75 avec au moins deux autres colonnes.