Ajustar y predecir para la regresión
Ahora que ya has visto cómo funciona la regresión lineal, tu tarea consiste en crear un modelo de regresión lineal múltiple utilizando todas las características del conjunto de datos sales_df
, que se ha cargado previamente para ti. Como recordatorio, aquí tienes las dos primeras filas:
tv radio social_media sales
1 13000.0 9237.76 2409.57 46677.90
2 41000.0 15886.45 2913.41 150177.83
A continuación, utilizarás este modelo para predecir las ventas en función de los valores de las características de prueba.
LinearRegression
y train_test_split
han sido precargados para ti desde sus respectivos módulos.
Este ejercicio forma parte del curso
Aprendizaje supervisado con scikit-learn
Instrucciones de ejercicio
- Crea
X
, una matriz que contenga los valores de todas las características desales_df
, yy
, que contenga todos los valores de la columna"sales"
. - Instanciar un modelo de regresión lineal.
- Ajusta el modelo a los datos de entrenamiento.
- Crea
y_pred
, haciendo predicciones parasales
utilizando las características de prueba.
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# Create X and y arrays
X = sales_df.____("____", axis=____).____
y = sales_df["____"].____
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
# Instantiate the model
reg = ____
# Fit the model to the data
____
# Make predictions
y_pred = reg.____(____)
print("Predictions: {}, Actual Values: {}".format(y_pred[:2], y_test[:2]))