Aan de slagGa gratis aan de slag

Controleren op gecorreleerde features

Je gaat terug naar de wine-gegevensset, die bestaat uit continue, numerieke features. Bereken Pearson’s correlatiecoëfficiënt op de gegevensset om te bepalen welke kolommen goede kandidaten zijn om te verwijderen. Verwijder daarna die kolommen uit de DataFrame.

Deze oefening maakt deel uit van de cursus

Preprocessing voor Machine Learning in Python

Cursus bekijken

Oefeninstructies

  • Print de Pearson-correlatiecoëfficiënten voor elk paar features in de wine-gegevensset.
  • Drop alle kolommen uit wine die een correlatiecoëfficiënt boven 0.75 hebben met minstens twee andere kolommen.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Print out the column correlations of the wine dataset
print(____)

# Drop that column from the DataFrame
wine = wine.____(____, ____)

print(wine.head())
Code bewerken en uitvoeren