1. Apprendre
  2. /
  3. Cours
  4. /
  5. Apprentissage supervisé avec scikit-learn

Connected

Exercice

Créer les caractéristiques

Dans ce chapitre, vous allez travailler avec un jeu de données nommé sales_df, qui contient des renseignements sur les dépenses de campagnes publicitaires selon différents types de médias, ainsi que le nombre de dollars générés en ventes pour chaque campagne. Le jeu de données a été préchargé pour vous. Voici les deux premières lignes :

     tv        radio      social_media    sales
1    13000.0   9237.76    2409.57         46677.90
2    41000.0   15886.45   2913.41         150177.83

Vous utiliserez les dépenses publicitaires comme caractéristiques pour prédire les valeurs de ventes, en commençant par la colonne "radio". Cependant, avant de faire des prédictions, vous devrez créer les tableaux de caractéristiques et de cible, puis les remodeler au format requis par scikit-learn.

Instructions

100 XP
  • Créez X, un tableau des valeurs de la colonne "radio" du DataFrame sales_df.
  • Créez y, un tableau des valeurs de la colonne "sales" du DataFrame sales_df.
  • Remodellez X en un tableau NumPy bidimensionnel.
  • Affichez la forme de X et y.