Verificare le feature correlate
Tornerai ora al dataset wine, che contiene feature continue e numeriche. Esegui il coefficiente di correlazione di Pearson sul dataset per individuare quali colonne sono buone candidate per l’eliminazione. Poi rimuovi quelle colonne dal DataFrame.
Questo esercizio fa parte del corso
Preprocessing per il Machine Learning in Python
Istruzioni dell'esercizio
- Stampa i coefficienti di correlazione di Pearson per ogni coppia di feature nel dataset
wine. - Elimina da
winetutte le colonne che hanno un coefficiente di correlazione superiore a 0,75 con almeno altre due colonne.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Print out the column correlations of the wine dataset
print(____)
# Drop that column from the DataFrame
wine = wine.____(____, ____)
print(wine.head())