LoslegenKostenlos loslegen

Ein erster Blick

Mit dem vollständigen Avazu-Datensatz wirst du neue Features erkunden, indem du dir die Datentypen der Spalten ansiehst. Die neuen Daten beinhalten kategoriale Spalten wie site_id, app_id, device_id usw. — allesamt verschiedene Kennungen für eine bestimmte Website, App bzw. einen Nutzer. Zum Einstieg identifizierst und gibst du die numerischen und kategorialen Spalten aus.

Beispieldaten als DataFrame sind als df geladen. pandas als pd steht dir ebenfalls in deiner Arbeitsumgebung zur Verfügung.

Diese Übung ist Teil des Kurses

CTR-Vorhersage mit Machine Learning in Python

Kurs anzeigen

Anleitung zur Übung

  • Gib die Spalten von df mit .columns aus.
  • Gib die zugehörigen Datentypen von df mit .dtypes aus.
  • Wähle den Teil von df mit numerischen Spalten aus (mit include = ['int', 'float']) und gib diese Spalten aus.
  • Wähle den Teil von df mit kategorialen Spalten aus (mit include = ['object']) und gib diese Spalten aus.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Print columns
print(df.____)

# Print data types of columns
print(df.____)

# Select and print numeric columns
numeric_df = df.____(include=['____', 'float'])
print(numeric_df.____)

# Select and print categorical columns 
categorical_df = df.____(include=['____'])
print(categorical_df.____)
Code bearbeiten und ausführen