CommencerCommencer gratuitement

Ajustement et prédiction de la régression

Maintenant que vous avez vu comment fonctionne la régression linéaire, votre tâche consiste à créer un modèle de régression linéaire multiple en utilisant toutes les caractéristiques de l’ensemble de données sales_df, qui a été préchargé pour vous. Pour rappel, voici les deux premières lignes :

     tv        radio      social_media    sales

1    13000.0   9237.76    2409.57         46677.90
2    41000.0   15886.45   2913.41         150177.83

Vous utiliserez ensuite ce modèle pour prédire les ventes en fonction des valeurs des caractéristiques de test.

LinearRegression et train_test_split ont été préchargés pour vous à partir de leurs modules respectifs.

Cet exercice fait partie du cours

Apprentissage supervisé avec scikit-learn

Afficher le cours

Instructions

  • Créez X, un tableau contenant les valeurs de toutes les caractéristiques de sales_df, et y, contenant toutes les valeurs de la colonne "sales".
  • Instanciez un modèle de régression linéaire.
  • Ajustez le modèle aux données d’apprentissage.
  • Créez y_pred, en faisant des prédictions pour sales à l’aide des caractéristiques de test.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Create X and y arrays
X = sales_df.____("____", axis=____).____
y = sales_df["____"].____

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

# Instantiate the model
reg = ____

# Fit the model to the data
____

# Make predictions
y_pred = reg.____(____)
print("Predictions: {}, Actual Values: {}".format(y_pred[:2], y_test[:2]))
Modifier et exécuter le code