ComenzarEmpieza gratis

Interpretar los coeficientes

Recuerda que el aeropuerto de origen, org, tiene ocho valores posibles (ORD, SFO, JFK, LGA, SMF, SJC, TUS y OGG) que se han codificado de un solo golpe en siete variables ficticias en org_dummy.

Los valores de km y org_dummy se han ensamblado en features, que tiene ocho columnas con representación dispersa. Los índices de columna en features son los siguientes:

  • 0 — km
  • 1 — ORD
  • 2 — SFO
  • 3 — JFK
  • 4 — LGA
  • 5 — SMF
  • 6 - SJC y
  • 7 — TUS.

Ten en cuenta que OGG no aparece en esta lista porque es el nivel de referencia para la categoría de aeropuerto de origen.

En este ejercicio utilizarás los atributos intercept y coefficients para interpretar el modelo.

El atributo coefficients es una lista, en la que el primer elemento indica cómo cambia la duración del vuelo con la distancia de vuelo.

Este ejercicio forma parte del curso

Machine learning con PySpark

Ver curso

Instrucciones de ejercicio

  • Halla la velocidad media en km por hora. Este valor será diferente del que obtuviste antes, porque tu modelo es ahora más sofisticado.
  • ¿Cuál es el tiempo medio en tierra en OGG?
  • ¿Cuál es el tiempo medio en tierra en el aeropuerto JFK?
  • ¿Cuál es el tiempo medio en tierra en LGA?

Ejercicio interactivo práctico

Pruebe este ejercicio completando este código de muestra.

# Average speed in km per hour
avg_speed_hour = ____
print(avg_speed_hour)

# Average minutes on ground at OGG
inter = regression.____
print(inter)

# Average minutes on ground at JFK
avg_ground_jfk = ____ + regression.____[____]
print(avg_ground_jfk)

# Average minutes on ground at LGA
avg_ground_lga = ____ + regression.____[____]
print(avg_ground_lga)
Editar y ejecutar código