Katsayıları yorumlama
Kalkış havaalanı org değişkeninin sekiz olası değeri (ORD, SFO, JFK, LGA, SMF, SJC, TUS ve OGG) olduğunu ve bunların org_dummy içinde yedi kukla değişkene one-hot encoded edildiğini unutma.
km ve org_dummy değerleri, seyrek gösterimle sekiz sütuna sahip features içine birleştirildi. features içindeki sütun indeksleri şöyledir:
- 0 —
km - 1 —
ORD - 2 —
SFO - 3 —
JFK - 4 —
LGA - 5 —
SMF - 6 —
SJCve - 7 —
TUS.
OGG bu listede görünmez; çünkü kalkış havaalanı kategorisi için referans düzeydir.
LinearRegression örneği regression içinde mevcut. Bu egzersizde modeli yorumlamak için intercept ve coefficients özniteliklerini kullanacaksın.
coefficients özniteliği bir listedir; ilk eleman uçuş süresinin uçuş mesafesiyle nasıl değiştiğini gösterir.
Bu egzersiz
PySpark ile Machine Learning
kursunun bir parçasıdırEgzersiz talimatları
- Saatte km cinsinden ortalama hızı bul. Modelin artık daha gelişmiş olduğundan, bu değer daha önce bulduğundan farklı olacaktır.
- OGG'de yerde geçirilen ortalama süre nedir?
- JFK'de yerde geçirilen ortalama süre nedir?
- LGA'da yerde geçirilen ortalama süre nedir?
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Average speed in km per hour
avg_speed_hour = ____
print(avg_speed_hour)
# Average minutes on ground at OGG
inter = regression.____
print(inter)
# Average minutes on ground at JFK
avg_ground_jfk = ____ + regression.____[____]
print(avg_ground_jfk)
# Average minutes on ground at LGA
avg_ground_lga = ____ + regression.____[____]
print(avg_ground_lga)