Ein erster Blick
Mit dem vollständigen Avazu-Datensatz wirst du neue Features erkunden, indem du dir die Datentypen der Spalten ansiehst. Die neuen Daten beinhalten kategoriale Spalten wie site_id, app_id, device_id usw. — allesamt verschiedene Kennungen für eine bestimmte Website, App bzw. einen Nutzer. Zum Einstieg identifizierst und gibst du die numerischen und kategorialen Spalten aus.
Beispieldaten als DataFrame sind als df geladen. pandas als pd steht dir ebenfalls in deiner Arbeitsumgebung zur Verfügung.
Diese Übung ist Teil des Kurses
<Kurs>CTR-Vorhersage mit Machine Learning in Python</Kurs>Übungsanweisungen
- Gib die Spalten von
dfmit.columnsaus. - Gib die zugehörigen Datentypen von
dfmit.dtypesaus. - Wähle den Teil von
dfmit numerischen Spalten aus (mitinclude = ['int', 'float']) und gib diese Spalten aus. - Wähle den Teil von
dfmit kategorialen Spalten aus (mitinclude = ['object']) und gib diese Spalten aus.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Print columns
print(df.____)
# Print data types of columns
print(df.____)
# Select and print numeric columns
numeric_df = df.____(include=['____', 'float'])
print(numeric_df.____)
# Select and print categorical columns
categorical_df = df.____(include=['____'])
print(categorical_df.____)