Features maken
In dit hoofdstuk werk je met een gegevensset genaamd sales_df, met informatie over advertentie-uitgaven per mediatype en het aantal dollars aan gegenereerde omzet voor de betreffende campagne. De gegevensset is alvast voor je geladen. Dit zijn de eerste twee rijen:
tv radio social_media sales
1 13000.0 9237.76 2409.57 46677.90
2 41000.0 15886.45 2913.41 150177.83
Je gebruikt de advertentie-uitgaven als features om de omzet te voorspellen, en begint met de kolom "radio". Voordat je voorspellingen kunt doen, moet je echter eerst de feature- en target-arrays maken en ze herschikken naar het juiste formaat voor scikit-learn.
Deze oefening maakt deel uit van de cursus
Supervised Learning met scikit-learn
Oefeninstructies
- Maak
X, een array met de waarden uit de"radio"-kolom van de DataFramesales_df. - Maak
y, een array met de waarden uit de"sales"-kolom van de DataFramesales_df. - Herschik
Xnaar een tweedimensionale NumPy-array. - Print de vorm (shape) van
Xeny.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
import numpy as np
# Create X from the radio column's values
X = ____
# Create y from the sales column's values
y = ____
# Reshape X
X = ____
# Check the shape of the features and targets
print(____)