MulaiMulai sekarang secara gratis

Prediksi data uji

Model logistik yang telah di-fit df_fitted tersedia. Sebuah dataframe df_testset tersedia yang berisi data uji untuk model ini. Variabel fields tersedia, berisi daftar ['prediction', 'label', 'endword', 'doc', 'probability']; ini digunakan untuk menentukan bidang prediksi mana yang akan dicetak.

Latihan ini adalah bagian dari kursus

Pengantar Spark SQL dalam Python

Lihat Kursus

Petunjuk latihan

  • Terapkan model pada data di df_testset.
  • Cetak "incorrect" jika prediksi tidak cocok dengan label.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Apply the model to the test data
predictions = df_fitted.____(____).select(fields)

# Print incorrect if prediction does not match label
for x in predictions.take(8):
    print()
    if x.label != int(x.____):
        print("INCORRECT ==> ")
    for y in fields:
        print(y,":", x[y])
Edit dan Jalankan Kode