1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Preprocessing pro Machine Learning v Pythonu

Connected

cvičení

Hledání korelovaných příznaků

Teď se vrátíme k datasetu wine, který obsahuje spojité numerické příznaky. Spusť Pearsonův korelační koeficient na celém datasetu a zjisti, které sloupce jsou vhodnými kandidáty na odstranění. Pak je z DataFrame vypusť.

Pokyny

100 XP
  • Vypiš Pearsonovy korelační koeficienty pro každou dvojici příznaků v datasetu wine.
  • Z wine odstraň všechny sloupce, které mají korelační koeficient vyšší než 0,75 s alespoň dvěma dalšími sloupci.