Auf korrelierte Features prüfen
Jetzt arbeitest du wieder mit dem wine-Datensatz, der aus kontinuierlichen, numerischen Features besteht. Führe Pearsons Korrelationskoeffizienten auf dem Datensatz aus, um zu bestimmen, welche Spalten sich als Kandidaten zum Entfernen eignen. Entferne anschließend diese Spalten aus dem DataFrame.
Diese Übung ist Teil des Kurses
Vorverarbeitung für Machine Learning in Python
Anleitung zur Übung
- Gib die Pearson-Korrelationskoeffizienten für jedes Feature-Paar im
wine-Datensatz aus. - Entferne alle Spalten aus
wine, die einen Korrelationskoeffizienten von über 0,75 mit mindestens zwei anderen Spalten aufweisen.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Print out the column correlations of the wine dataset
print(____)
# Drop that column from the DataFrame
wine = wine.____(____, ____)
print(wine.head())