Ajustar y predecir para la regresión
Ahora que ya has visto cómo funciona la regresión lineal, tu tarea consiste en crear un modelo de regresión lineal múltiple utilizando todas las características del conjunto de datos precargado sales_df
. Como recordatorio, aquí tienes las dos primeras filas:
tv radio social_media sales
1 13000.0 9237.76 2409.57 46677.90
2 41000.0 15886.45 2913.41 150177.83
A continuación, utilizarás este modelo para predecir las ventas en función de los valores de las características de prueba.
LinearRegression
y train_test_split
han sido precargados para ti desde sus respectivos módulos.
Este ejercicio forma parte del curso
Aprendizaje supervisado con scikit-learn
Instrucciones del ejercicio
- Crea
X
, una matriz que contenga los valores de todas las características desales_df
, ey
, que contenga todos los valores de la columna"sales"
. - Instancia un modelo de regresión lineal.
- Ajusta el modelo a los datos de entrenamiento.
- Crea
y_pred
, haciendo predicciones parasales
utilizando las características de prueba.
Ejercicio interactivo práctico
Prueba este ejercicio completando el código de muestra.
# Create X and y arrays
X = sales_df.____("____", axis=____).____
y = sales_df["____"].____
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
# Instantiate the model
reg = ____
# Fit the model to the data
____
# Make predictions
y_pred = reg.____(____)
print("Predictions: {}, Actual Values: {}".format(y_pred[:2], y_test[:2]))