Entraîner un modèle simple
Comme vous l’avez déterminé, vous êtes face à un problème de régression. Vous êtes donc prêt à construire un modèle pour une soumission ultérieure. Mais au lieu d’entraîner le modèle de Régression Linéaire le plus simple présenté dans le diaporama, construisons un modèle Random Forest prêt à l’emploi.
Vous allez utiliser la classe RandomForestRegressor de la bibliothèque scikit-learn.
Votre objectif est d’entraîner un modèle Random Forest avec les paramètres par défaut sur les variables « store » et « item ».
Cet exercice fait partie du cours
Gagner une compétition Kaggle en Python
Instructions
- Lisez les données d’entraînement avec
pandas. - Créez un objet Random Forest.
- Entraînez le modèle Random Forest sur les variables « store » et « item » avec « sales » comme cible.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
import pandas as pd
from sklearn.ensemble import RandomForestRegressor
# Read the train data
train = ____.____('train.csv')
# Create a Random Forest object
rf = ____()
# Train a model
rf.fit(X=train[['store', ____]], y=train['____'])