Prediksi data uji
Model logistik yang telah di-fit df_fitted tersedia. Sebuah dataframe df_testset tersedia yang berisi data uji untuk model ini. Variabel fields tersedia, berisi daftar ['prediction', 'label', 'endword', 'doc', 'probability']; ini digunakan untuk menentukan bidang prediksi mana yang akan dicetak.
Latihan ini merupakan bagian dari kursus
Pengantar Spark SQL dalam Python
Instruksi latihan
- Terapkan model pada data di
df_testset. - Cetak "incorrect" jika prediksi tidak cocok dengan label.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Apply the model to the test data
predictions = df_fitted.____(____).select(fields)
# Print incorrect if prediction does not match label
for x in predictions.take(8):
print()
if x.label != int(x.____):
print("INCORRECT ==> ")
for y in fields:
print(y,":", x[y])