Ajustando um modelo simples: regressão
Neste exercício, você vai praticar o ajuste de um modelo de regressão usando dados do mercado imobiliário da Califórnia. Um DataFrame chamado housing está disponível no seu ambiente. Ele contém várias variáveis (armazenadas como colunas). Você consegue encontrar uma relação entre as duas variáveis abaixo?
"MedHouseVal": valor mediano das casas nos distritos da Califórnia (em $100.000)"AveRooms": número médio de cômodos por residência
Este exercício faz parte do curso
Machine Learning para dados de séries temporais em Python
Instruções do exercício
- Prepare os DataFrames
Xeyusando os dados emhousing.Xdeve ser o valor mediano das casas;y, o número médio de cômodos por residência.
- Ajuste um modelo de regressão que utilize essas variáveis (lembre-se de dar o formato correto às variáveis!).
- Não se esqueça de que cada variável deve ter o formato correto para o scikit-learn usá-la!
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
from sklearn import linear_model
# Prepare input and output DataFrames
X = ____
y = ____
# Fit the model
model = linear_model.LinearRegression()
model.fit(____)