Aan de slagBegin gratis

Controleren op gecorreleerde features

Je gaat terug naar de wine-gegevensset, die bestaat uit continue, numerieke features. Bereken Pearson’s correlatiecoëfficiënt op de gegevensset om te bepalen welke kolommen goede kandidaten zijn om te verwijderen. Verwijder daarna die kolommen uit de DataFrame.

Deze oefening maakt deel uit van de cursus

Preprocessing voor Machine Learning in Python

Bekijk cursus

Oefeninstructies

  • Print de Pearson-correlatiecoëfficiënten voor elk paar features in de wine-gegevensset.
  • Drop alle kolommen uit wine die een correlatiecoëfficiënt boven 0.75 hebben met minstens twee andere kolommen.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Print out the column correlations of the wine dataset
print(____)

# Drop that column from the DataFrame
wine = wine.____(____, ____)

print(wine.head())
Code bewerken en uitvoeren