MulaiMulai sekarang secara gratis

Menafsirkan koefisien

Ingat bahwa bandara asal, org, memiliki delapan kemungkinan nilai (ORD, SFO, JFK, LGA, SMF, SJC, TUS, dan OGG) yang telah di-one-hot encode menjadi tujuh variabel boneka dalam org_dummy.

Nilai untuk km dan org_dummy telah digabungkan ke dalam features, yang memiliki delapan kolom dengan representasi sparse. Indeks kolom dalam features adalah sebagai berikut:

  • 0 — km
  • 1 — ORD
  • 2 — SFO
  • 3 — JFK
  • 4 — LGA
  • 5 — SMF
  • 6 — SJC dan
  • 7 — TUS.

Perhatikan bahwa OGG tidak muncul dalam daftar ini karena merupakan level referensi untuk kategori bandara asal.

Sebuah instance LinearRegression tersedia dalam regression. Dalam latihan ini Anda akan menggunakan atribut intercept dan coefficients untuk menafsirkan model.

Atribut coefficients adalah sebuah daftar, di mana elemen pertama menunjukkan bagaimana durasi penerbangan berubah terhadap jarak penerbangan.

Latihan ini adalah bagian dari kursus

Machine Learning dengan PySpark

Lihat Kursus

Petunjuk latihan

  • Temukan kecepatan rata-rata dalam km per jam. Ini akan berbeda dari nilai yang Anda dapatkan sebelumnya karena model Anda sekarang lebih canggih.
  • Berapa waktu rata-rata di darat di OGG?
  • Berapa waktu rata-rata di darat di JFK?
  • Berapa waktu rata-rata di darat di LGA?

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Average speed in km per hour
avg_speed_hour = ____
print(avg_speed_hour)

# Average minutes on ground at OGG
inter = regression.____
print(inter)

# Average minutes on ground at JFK
avg_ground_jfk = ____ + regression.____[____]
print(avg_ground_jfk)

# Average minutes on ground at LGA
avg_ground_lga = ____ + regression.____[____]
print(avg_ground_lga)
Edit dan Jalankan Kode