Interpretação de coeficientes
Lembre-se de que o aeroporto de origem, org
, tem oito valores possíveis (ORD, SFO, JFK, LGA, SMF, SJC, TUS e OGG) que foram codificados em um único ponto para sete variáveis fictícias em org_dummy
.
Os valores de km
e org_dummy
foram reunidos em features
, que tem oito colunas com representação esparsa. Os índices de coluna em features
são os seguintes:
- 0 —
km
- 1 —
ORD
- 2 —
SFO
- 3 —
JFK
- 4 —
LGA
- 5 —
SMF
- 6 -
SJC
e - 7 —
TUS
.
Observe que o site OGG
não aparece nessa lista porque é o nível de referência para a categoria de aeroporto de origem.
Uma instância de LinearRegression
está disponível em regression
. Neste exercício, você usará os atributos intercept
e coefficients
para interpretar o modelo.
O atributo coefficients
é uma lista, em que o primeiro elemento indica como a duração do voo muda com a distância do voo.
Este exercício faz parte do curso
Aprendizado de máquina com PySpark
Instruções de exercício
- Encontre a velocidade média em quilômetros por hora. Esse valor será diferente do valor que você obteve anteriormente porque seu modelo agora é mais sofisticado.
- Qual é o tempo médio de permanência no solo em OGG?
- Qual é o tempo médio de permanência no solo em JFK?
- Qual é o tempo médio de permanência no solo em LGA?
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Average speed in km per hour
avg_speed_hour = ____
print(avg_speed_hour)
# Average minutes on ground at OGG
inter = regression.____
print(inter)
# Average minutes on ground at JFK
avg_ground_jfk = ____ + regression.____[____]
print(avg_ground_jfk)
# Average minutes on ground at LGA
avg_ground_lga = ____ + regression.____[____]
print(avg_ground_lga)