Création de caractéristiques
Dans ce chapitre, vous travaillerez avec un ensemble de données appelé sales_df
, qui contient des informations sur les dépenses des campagnes publicitaires dans différents types de médias, et le montant des ventes générées en dollars pour la campagne respective. L’ensemble de données a été préchargé pour vous. Voici les deux premières lignes :
tv radio social_media sales
1 13000.0 9237.76 2409.57 46677.90
2 41000.0 15886.45 2913.41 150177.83
Vous utiliserez les dépenses publicitaires comme caractéristiques pour prédire les valeurs des ventes, en travaillant d’abord avec la colonne "radio"
. Cependant, avant de faire des prédictions, vous devrez créer les tableaux de caractéristiques et de cibles, en les adaptant au format correct pour scikit-learn.
Cet exercice fait partie du cours
Apprentissage supervisé avec scikit-learn
Instructions d’exercice
- Créez
X
, un tableau contenant les valeurs de la colonne"radio"
du DataFramesales_df
. - Créez
y
, un tableau contenant les valeurs de la colonne"sales"
du DataFramesales_df
. - Convertissez
X
en un tableau NumPy à deux dimensions. - Affichez la forme de
X
ety
.
Exercice interactif pratique
Essayez-vous à cet exercice en complétant cet exemple de code.
import numpy as np
# Create X from the radio column's values
X = ____
# Create y from the sales column's values
y = ____
# Reshape X
X = ____
# Check the shape of the features and targets
print(____)