IniziaInizia gratis

Interpretare i coefficienti

Ricorda che l’aeroporto di origine, org, ha otto possibili valori (ORD, SFO, JFK, LGA, SMF, SJC, TUS e OGG) che sono stati convertiti in sette variabili fittizie con one-hot encoding in org_dummy.

I valori di km e org_dummy sono stati assemblati in features, che ha otto colonne in rappresentazione sparsa. Gli indici di colonna in features sono i seguenti:

  • 0 — km
  • 1 — ORD
  • 2 — SFO
  • 3 — JFK
  • 4 — LGA
  • 5 — SMF
  • 6 — SJC e
  • 7 — TUS.

Nota che OGG non compare in questo elenco perché è il livello di riferimento per la categoria dell’aeroporto di origine.

Un’istanza di LinearRegression è disponibile in regression. In questo esercizio userai gli attributi intercept e coefficients per interpretare il modello.

L’attributo coefficients è una lista, in cui il primo elemento indica come cambia la durata del volo al variare della distanza.

Questo esercizio fa parte del corso

Machine Learning con PySpark

Visualizza il corso

Istruzioni dell'esercizio

  • Trova la velocità media in km all’ora. Sarà diversa dal valore che hai ottenuto prima perché ora il tuo modello è più sofisticato.
  • Qual è il tempo medio a terra a OGG?
  • Qual è il tempo medio a terra a JFK?
  • Qual è il tempo medio a terra a LGA?

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Average speed in km per hour
avg_speed_hour = ____
print(avg_speed_hour)

# Average minutes on ground at OGG
inter = regression.____
print(inter)

# Average minutes on ground at JFK
avg_ground_jfk = ____ + regression.____[____]
print(avg_ground_jfk)

# Average minutes on ground at LGA
avg_ground_lga = ____ + regression.____[____]
print(avg_ground_lga)
Modifica ed esegui il codice