Ajustando um modelo de regressão linear
Uma pesquisa salarial anônima é realizada anualmente desde 2015 entre especialistas de TI na Europa. Em 2018, centenas de participantes se voluntariaram. Nos dados da pesquisa, estão incluídos o número de anos de experiência dos respondentes e o salário atual.
Você vai analisar a relação entre essas duas variáveis para descobrir se mais anos de experiência resultam em salário maior ou menor.
Sua variável independente é experience_years, e sua variável dependente é current_salary.
Os dados foram carregados para você como data, juntamente com statsmodels.api e pandas, como sm e pd, respectivamente.
Este exercício faz parte do curso
Análise de dados de pesquisa em Python
Instruções do exercício
- Defina as variáveis
xey. - Adicione o termo constante.
- Execute a regressão
OLS()e.fit()no modelo. - Imprima a tabela de resumo.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Define variable, x and y
x = salary_survey.____.____
y = salary_survey.____.____
# Add the constant term
x = ____.____(x)
# Perform .OLS() regression and fit
result = ____.____(y,x).____()
# Print the summary table
print(____.____())