Visualizando dados de pesquisa
Dando continuidade ao exercício anterior sobre dados de pesquisa com especialistas de TI europeus, visualize a relação linear entre experience_years e current_salary para ter uma estimativa aproximada do que diferentes níveis de experiência estão ganhando.
Os dados foram carregados para você como data, junto com pandas, Matplotlib.pyplot e NumPy, como pd, plt e np, respectivamente.
Este exercício faz parte do curso
Análise de dados de pesquisa em Python
Instruções do exercício
- Plote os valores originais usando um gráfico de dispersão (scatter).
- Obtenha o intervalo dos dados.
- Obtenha o intervalo de valores para traçar a linha de regressão.
- Plote a linha de regressão.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Plot the original values using a scatter plot
x = data.____
y = data.____
____.____(x,y)
# Get the range of data
max_x = ____
min_x = ____
# Get the range of values
x = ____.____(min_x,max_x,1)
y = 1590.4569 * x + 58080
# Plot the regression line
____.____(x, y,'r')
plt.show()