Découverte de la base de données de films
Tout au long de ce chapitre, vous allez travailler avec TMDb (The Movie Database). Elle contient des métadonnées sur environ 5 000 films.
Le jeu de données est chargé et disponible sous le nom movies.
Votre objectif principal est de prédire le revenu d’un film — plus précisément, le log-revenue, qui est la version normalisée de la variable revenue.
Utilisez la méthode .describe() pour explorer la variable target, qui contient les valeurs représentées dans l’histogramme. Vous pouvez également examiner l’histogramme à droite. Qu’en concluez-vous ?
Cet exercice fait partie du cours
Méthodes d’ensemble en Python
Exercice interactif pratique
Passez de la théorie à la pratique avec l’un de nos exercices interactifs
Commencer l’exercice