Aan de slagGa gratis aan de slag

Features maken

In dit hoofdstuk werk je met een gegevensset genaamd sales_df, met informatie over advertentie-uitgaven per mediatype en het aantal dollars aan gegenereerde omzet voor de betreffende campagne. De gegevensset is alvast voor je geladen. Dit zijn de eerste twee rijen:

     tv        radio      social_media    sales
1    13000.0   9237.76    2409.57         46677.90
2    41000.0   15886.45   2913.41         150177.83

Je gebruikt de advertentie-uitgaven als features om de omzet te voorspellen, en begint met de kolom "radio". Voordat je voorspellingen kunt doen, moet je echter eerst de feature- en target-arrays maken en ze herschikken naar het juiste formaat voor scikit-learn.

Deze oefening maakt deel uit van de cursus

Supervised Learning met scikit-learn

Cursus bekijken

Oefeninstructies

  • Maak X, een array met de waarden uit de "radio"-kolom van de DataFrame sales_df.
  • Maak y, een array met de waarden uit de "sales"-kolom van de DataFrame sales_df.
  • Herschik X naar een tweedimensionale NumPy-array.
  • Print de vorm (shape) van X en y.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

import numpy as np

# Create X from the radio column's values
X = ____

# Create y from the sales column's values
y = ____

# Reshape X
X = ____

# Check the shape of the features and targets
print(____)
Code bewerken en uitvoeren