Bestimmte Datentypen auswählen
Oft enthält ein Datensatz Spalten mit mehreren verschiedenen Datentypen (so wie der, mit dem du hier arbeitest). Die meisten Machine-Learning-Modelle erfordern konsistente Datentypen über alle Features hinweg. Ebenso lassen sich die meisten Feature-Engineering-Techniken jeweils nur auf einen bestimmten Datentyp anwenden. Aus diesen und weiteren Gründen möchtest du bei der Arbeit mit einem DataFrame häufig nur die Spalten eines bestimmten Typs auswählen können.
Der DataFrame (so_survey_df) aus der vorherigen Übung steht in deinem Workspace zur Verfügung.
Diese Übung ist Teil des Kurses
<Kurs>Feature Engineering für Machine Learning in Python</Kurs>Übungsanweisungen
- Erstelle eine Teilmenge von
so_survey_df, die nur die numerischen (intundfloat) Spalten umfasst. - Gib die in
so_survey_df_numenthaltenen Spaltennamen aus.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Create subset of only the numeric columns
so_numeric_df = so_survey_df.____(____=[____])
# Print the column names contained in so_survey_df_num
print(so_numeric_df.____)