Koeffizienten interpretieren
Erinnere dich daran, dass der Herkunftsflughafen org
acht mögliche Werte hat (ORD, SFO, JFK, LGA, SMF, SJC, TUS und OGG), die in org_dummy
in sieben Dummy-Variablen kodiert wurden.
Die Werte für km
und org_dummy
wurden zu features
zusammengefasst, das acht Spalten mit spärlicher Darstellung hat. Die Spaltenindizes in features
lauten wie folgt:
- 0 —
km
- 1 —
ORD
- 2 —
SFO
- 3 —
JFK
- 4 —
LGA
- 5 —
SMF
- 6 -
SJC
und - 7 —
TUS
.
Beachte, dass OGG
in dieser Liste nicht auftaucht, weil es die Referenzebene für die Kategorie der Herkunftsflughäfen ist.
Eine Instanz von LinearRegression
ist unter regression
verfügbar. In dieser Übung wirst du die Attribute intercept
und coefficients
verwenden, um das Modell zu interpretieren.
Das Attribut coefficients
ist eine Liste, in der das erste Element angibt, wie sich die Flugdauer mit der Flugentfernung verändert.
Diese Übung ist Teil des Kurses
Maschinelles Lernen mit PySpark
Anleitung zur Übung
- Bestimme die Durchschnittsgeschwindigkeit in km pro Stunde. Dieser Wert wird sich von dem unterscheiden, den du früher erhalten hast, weil dein Modell jetzt ausgefeilter ist.
- Wie lange bist du im Durchschnitt bei OGG unterwegs?
- Wie lange ist die durchschnittliche Zeit am Boden in JFK?
- Wie lange ist die durchschnittliche Zeit am Boden in LGA?
Interaktive Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Average speed in km per hour
avg_speed_hour = ____
print(avg_speed_hour)
# Average minutes on ground at OGG
inter = regression.____
print(inter)
# Average minutes on ground at JFK
avg_ground_jfk = ____ + regression.____[____]
print(avg_ground_jfk)
# Average minutes on ground at LGA
avg_ground_lga = ____ + regression.____[____]
print(avg_ground_lga)