LoslegenKostenlos loslegen

Koeffizienten interpretieren

Erinnere dich daran, dass der Herkunftsflughafen org acht mögliche Werte hat (ORD, SFO, JFK, LGA, SMF, SJC, TUS und OGG), die in org_dummy in sieben Dummy-Variablen kodiert wurden.

Die Werte für km und org_dummy wurden zu features zusammengefasst, das acht Spalten mit spärlicher Darstellung hat. Die Spaltenindizes in features lauten wie folgt:

  • 0 — km
  • 1 — ORD
  • 2 — SFO
  • 3 — JFK
  • 4 — LGA
  • 5 — SMF
  • 6 - SJC und
  • 7 — TUS.

Beachte, dass OGG in dieser Liste nicht auftaucht, weil es die Referenzebene für die Kategorie der Herkunftsflughäfen ist.

Eine Instanz von LinearRegression ist unter regression verfügbar. In dieser Übung wirst du die Attribute intercept und coefficients verwenden, um das Modell zu interpretieren.

Das Attribut coefficients ist eine Liste, in der das erste Element angibt, wie sich die Flugdauer mit der Flugentfernung verändert.

Diese Übung ist Teil des Kurses

Maschinelles Lernen mit PySpark

Kurs anzeigen

Anleitung zur Übung

  • Bestimme die Durchschnittsgeschwindigkeit in km pro Stunde. Dieser Wert wird sich von dem unterscheiden, den du früher erhalten hast, weil dein Modell jetzt ausgefeilter ist.
  • Wie lange bist du im Durchschnitt bei OGG unterwegs?
  • Wie lange ist die durchschnittliche Zeit am Boden in JFK?
  • Wie lange ist die durchschnittliche Zeit am Boden in LGA?

Interaktive Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Average speed in km per hour
avg_speed_hour = ____
print(avg_speed_hour)

# Average minutes on ground at OGG
inter = regression.____
print(inter)

# Average minutes on ground at JFK
avg_ground_jfk = ____ + regression.____[____]
print(avg_ground_jfk)

# Average minutes on ground at LGA
avg_ground_lga = ____ + regression.____[____]
print(avg_ground_lga)
Code bearbeiten und ausführen