ComenzarEmpieza gratis

Interpretación de los coeficientes

Recuerda que el aeropuerto de origen, org, tiene ocho valores posibles (ORD, SFO, JFK, LGA, SMF, SJC, TUS y OGG) que se han codificado de forma única en siete variables ficticias en org_dummy.

Los valores de km y org_dummy se han reunido en features, que tiene ocho columnas con representación dispersa. Los índices de columna en features son los siguientes:

  • 0 — km
  • 1 — ORD
  • 2 — SFO
  • 3 — JFK
  • 4 — LGA
  • 5 — SMF
  • 6 — SJC y
  • 7 — TUS.

Ten en cuenta que « OGG » no aparece en esta lista porque es el nivel de referencia para la categoría de aeropuerto de origen.

Puedes encontrar un ejemplo de LinearRegression en regression. En este ejercicio utilizarás los atributos « intercept » y « coefficients » para interpretar el modelo.

El atributo « coefficients » es una lista en la que el primer elemento indica cómo cambia la duración del vuelo en función de la distancia.

Este ejercicio forma parte del curso

Machine learning con PySpark

Ver curso

Instrucciones del ejercicio

  • Halla la velocidad media en kilómetros por hora. Este valor será diferente al que obtuviste anteriormente, ya que tu modelo ahora es más sofisticado.
  • ¿Cuál es el tiempo medio de permanencia en tierra en OGG?
  • ¿Cuál es el tiempo medio de permanencia en tierra en el aeropuerto JFK?
  • ¿Cuál es el tiempo medio de permanencia en tierra en LGA?

Ejercicio interactivo práctico

Prueba este ejercicio completando el código de muestra.

# Average speed in km per hour
avg_speed_hour = ____
print(avg_speed_hour)

# Average minutes on ground at OGG
inter = regression.____
print(inter)

# Average minutes on ground at JFK
avg_ground_jfk = ____ + regression.____[____]
print(avg_ground_jfk)

# Average minutes on ground at LGA
avg_ground_lga = ____ + regression.____[____]
print(avg_ground_lga)
Editar y ejecutar código