Ein erster Blick
Mit dem vollständigen Avazu-Datensatz wirst du neue Features erkunden, indem du dir die Datentypen der Spalten ansiehst. Die neuen Daten beinhalten kategoriale Spalten wie site_id, app_id, device_id usw. — allesamt verschiedene Kennungen für eine bestimmte Website, App bzw. einen Nutzer. Zum Einstieg identifizierst und gibst du die numerischen und kategorialen Spalten aus.
Beispieldaten als DataFrame sind als df geladen. pandas als pd steht dir ebenfalls in deiner Arbeitsumgebung zur Verfügung.
Diese Übung ist Teil des Kurses
CTR-Vorhersage mit Machine Learning in Python
Anleitung zur Übung
- Gib die Spalten von
dfmit.columnsaus. - Gib die zugehörigen Datentypen von
dfmit.dtypesaus. - Wähle den Teil von
dfmit numerischen Spalten aus (mitinclude = ['int', 'float']) und gib diese Spalten aus. - Wähle den Teil von
dfmit kategorialen Spalten aus (mitinclude = ['object']) und gib diese Spalten aus.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Print columns
print(df.____)
# Print data types of columns
print(df.____)
# Select and print numeric columns
numeric_df = df.____(include=['____', 'float'])
print(numeric_df.____)
# Select and print categorical columns
categorical_df = df.____(include=['____'])
print(categorical_df.____)