Crear características
En este capítulo, trabajarás con un conjunto de datos llamado sales_df
, que contiene información sobre el gasto en campañas publicitarias en distintos tipos de medios y el número de dólares generados en ventas por la campaña respectiva. Se ha precargado el conjunto de datos. Aquí tienes las dos primeras filas:
tv radio social_media sales
1 13000.0 9237.76 2409.57 46677.90
2 41000.0 15886.45 2913.41 150177.83
Utilizarás los gastos de publicidad como características para predecir los valores de las ventas, trabajando inicialmente con la columna "radio"
. Sin embargo, antes de hacer ninguna predicción, tendrás que crear las matrices de características y objetivos, dándoles el formato correcto para scikit-learn.
Este ejercicio forma parte del curso
Aprendizaje supervisado con scikit-learn
Instrucciones de ejercicio
- Crea
X
, una matriz con los valores de la columna"radio"
del DataFramesales_df
. - Crea
y
, una matriz con los valores de la columna"sales"
del DataFramesales_df
. - Remodela
X
en una matriz NumPy bidimensional. - Imprime la forma de
X
yy
.
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
import numpy as np
# Create X from the radio column's values
X = ____
# Create y from the sales column's values
y = ____
# Reshape X
X = ____
# Check the shape of the features and targets
print(____)