Interpretare i coefficienti
Ricorda che l’aeroporto di origine, org, ha otto possibili valori (ORD, SFO, JFK, LGA, SMF, SJC, TUS e OGG) che sono stati convertiti in sette variabili fittizie con one-hot encoding in org_dummy.
I valori di km e org_dummy sono stati assemblati in features, che ha otto colonne in rappresentazione sparsa. Gli indici di colonna in features sono i seguenti:
- 0 —
km - 1 —
ORD - 2 —
SFO - 3 —
JFK - 4 —
LGA - 5 —
SMF - 6 —
SJCe - 7 —
TUS.
Nota che OGG non compare in questo elenco perché è il livello di riferimento per la categoria dell’aeroporto di origine.
Un’istanza di LinearRegression è disponibile in regression. In questo esercizio userai gli attributi intercept e coefficients per interpretare il modello.
L’attributo coefficients è una lista, in cui il primo elemento indica come cambia la durata del volo al variare della distanza.
Questo esercizio fa parte del corso
Machine Learning con PySpark
Istruzioni dell'esercizio
- Trova la velocità media in km all’ora. Sarà diversa dal valore che hai ottenuto prima perché ora il tuo modello è più sofisticato.
- Qual è il tempo medio a terra a OGG?
- Qual è il tempo medio a terra a JFK?
- Qual è il tempo medio a terra a LGA?
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Average speed in km per hour
avg_speed_hour = ____
print(avg_speed_hour)
# Average minutes on ground at OGG
inter = regression.____
print(inter)
# Average minutes on ground at JFK
avg_ground_jfk = ____ + regression.____[____]
print(avg_ground_jfk)
# Average minutes on ground at LGA
avg_ground_lga = ____ + regression.____[____]
print(avg_ground_lga)