CommencerCommencez gratuitement

Création de caractéristiques

Dans ce chapitre, vous travaillerez avec un ensemble de données appelé sales_df, qui contient des informations sur les dépenses des campagnes publicitaires dans différents types de médias, et le montant des ventes générées en dollars pour la campagne respective. L’ensemble de données a été préchargé pour vous. Voici les deux premières lignes :

     tv        radio      social_media    sales

1    13000.0   9237.76    2409.57         46677.90
2    41000.0   15886.45   2913.41         150177.83

Vous utiliserez les dépenses publicitaires comme caractéristiques pour prédire les valeurs des ventes, en travaillant d’abord avec la colonne "radio". Cependant, avant de faire des prédictions, vous devrez créer les tableaux de caractéristiques et de cibles, en les adaptant au format correct pour scikit-learn.

Cet exercice fait partie du cours

Apprentissage supervisé avec scikit-learn

Afficher le cours

Instructions d’exercice

  • Créez X, un tableau contenant les valeurs de la colonne "radio" du DataFrame sales_df.
  • Créez y, un tableau contenant les valeurs de la colonne "sales" du DataFrame sales_df.
  • Convertissez X en un tableau NumPy à deux dimensions.
  • Affichez la forme de X et y.

Exercice interactif pratique

Essayez-vous à cet exercice en complétant cet exemple de code.

import numpy as np

# Create X from the radio column's values
X = ____

# Create y from the sales column's values
y = ____

# Reshape X
X = ____

# Check the shape of the features and targets
print(____)
Modifier et exécuter du code