Plotando regressões bootstrap
Uma boa forma de visualizar a variabilidade que podemos esperar em uma regressão linear é traçar a reta que você obteria de cada repetição bootstrap da inclinação e da interceptação. Faça isso para as primeiras 100 repetições bootstrap da inclinação e da interceptação (armazenadas como bs_slope_reps e bs_intercept_reps).
Este exercício faz parte do curso
Pensamento Estatístico em Python (Parte 2)
Instruções do exercício
- Gere um array de valores de \(x\) contendo
0e100para o gráfico das retas de regressão. Use a funçãonp.array()para isso. - Escreva um loop
forem que você plote uma reta de regressão com inclinação e interceptação dadas pelas repetições bootstrap em pares. Faça isso para100retas.- Ao plotar as retas de regressão em cada iteração do loop
for, lembre-se da equação de regressãoy = a*x + b. Aqui,aébs_slope_reps[i]ebébs_intercept_reps[i]. - Especifique os argumentos nomeados
linewidth=0.5,alpha=0.2ecolor='red'na sua chamada aplt.plot().
- Ao plotar as retas de regressão em cada iteração do loop
- Faça um diagrama de dispersão com
illiteracyno eixo x efertilityno eixo y. Lembre-se de especificar os argumentos nomeadosmarker='.'elinestyle='none'. - Rotule os eixos, defina uma margem de 2% e mostre o gráfico. Isso já foi feito para você, então clique em Enviar Resposta para visualizar as regressões bootstrap!
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Generate array of x-values for bootstrap lines: x
x = ____
# Plot the bootstrap lines
for i in range(____):
_ = plt.plot(____,
____*x + ____,
____=0.5, ____=0.2, ____='red')
# Plot the data
_ = ____
# Label axes, set the margins, and show the plot
_ = plt.xlabel('illiteracy')
_ = plt.ylabel('fertility')
plt.margins(0.02)
plt.show()