CommencerCommencer gratuitement

Entraîner un modèle simple

Comme vous l’avez déterminé, vous êtes face à un problème de régression. Vous êtes donc prêt à construire un modèle pour une soumission ultérieure. Mais au lieu d’entraîner le modèle de Régression Linéaire le plus simple présenté dans le diaporama, construisons un modèle Random Forest prêt à l’emploi.

Vous allez utiliser la classe RandomForestRegressor de la bibliothèque scikit-learn.

Votre objectif est d’entraîner un modèle Random Forest avec les paramètres par défaut sur les variables « store » et « item ».

Cet exercice fait partie du cours

Gagner une compétition Kaggle en Python

Afficher le cours

Instructions

  • Lisez les données d’entraînement avec pandas.
  • Créez un objet Random Forest.
  • Entraînez le modèle Random Forest sur les variables « store » et « item » avec « sales » comme cible.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

import pandas as pd
from sklearn.ensemble import RandomForestRegressor

# Read the train data
train = ____.____('train.csv')

# Create a Random Forest object
rf = ____()

# Train a model
rf.fit(X=train[['store', ____]], y=train['____'])
Modifier et exécuter le code