Ajuste e previsão para regressão
Agora que você já viu como funciona a regressão linear, sua tarefa é criar um modelo de regressão linear múltipla usando todas as variáveis independentes do conjunto de dados sales_df
, que foi pré-carregado para você. Como lembrete, estas são as duas primeiras linhas:
tv radio social_media sales
1 13000.0 9237.76 2409.57 46677.90
2 41000.0 15886.45 2913.41 150177.83
Em seguida, você deve usar esse modelo para prever as vendas com base nos valores das variáveis independentes de teste.
LinearRegression
e train_test_split
foram pré-carregados para você a partir de seus respectivos módulos.
Este exercício faz parte do curso
Aprendizado Supervisionado com o scikit-learn
Instruções do exercício
- Crie
X
, uma matriz que contém os valores de todas as variáveis independentes desales_df
, ey
, que contém todos os valores da coluna"sales"
. - Instancie um modelo de regressão linear.
- Ajuste o modelo aos dados de treinamento.
- Crie
y_pred
, fazendo previsões parasales
usando as variáveis independentes de teste.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Create X and y arrays
X = sales_df.____("____", axis=____).____
y = sales_df["____"].____
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
# Instantiate the model
reg = ____
# Fit the model to the data
____
# Make predictions
y_pred = reg.____(____)
print("Predictions: {}, Actual Values: {}".format(y_pred[:2], y_test[:2]))