Einführung in die Filmdatenbank
In diesem Kapitel arbeitest du mit TMDb (The Movie Database). Sie enthält Metadaten zu rund 5000 Filmen.
Der Datensatz ist geladen und als movies verfügbar.
Dein Hauptziel ist es, die Film-Einnahmen vorherzusagen – genauer gesagt die Log-Einnahmen, also die normalisierte Version des Merkmals revenue.
Nutze die Methode .describe(), um die Variable target zu untersuchen, die die Werte im Histogramm enthält. Du kannst dir auch das Histogramm rechts ansehen. Was kannst du daraus schließen?
Diese Übung ist Teil des Kurses
Ensemble-Methoden in Python
Interaktive Übung
In dieser interaktiven Übung kannst du die Theorie in die Praxis umsetzen.
Übung starten