Auf korrelierte Features prüfen
Jetzt arbeitest du wieder mit dem wine-Datensatz, der aus kontinuierlichen, numerischen Features besteht. Führe Pearsons Korrelationskoeffizienten auf dem Datensatz aus, um zu bestimmen, welche Spalten sich als Kandidaten zum Entfernen eignen. Entferne anschließend diese Spalten aus dem DataFrame.
Diese Übung ist Teil des Kurses
<Kurs>Vorverarbeitung für Machine Learning in Python</Kurs>Übungsanweisungen
- Gib die Pearson-Korrelationskoeffizienten für jedes Feature-Paar im
wine-Datensatz aus. - Entferne alle Spalten aus
wine, die einen Korrelationskoeffizienten von über 0,75 mit mindestens zwei anderen Spalten aufweisen.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Print out the column correlations of the wine dataset
print(____)
# Drop that column from the DataFrame
wine = wine.____(____, ____)
print(wine.head())