Test verilerini tahmin et
Uyarlanmış bir lojistik model df_fitted mevcut. Bu model için test verilerini içeren bir dataframe df_testset mevcut. ['prediction', 'label', 'endword', 'doc', 'probability'] listesini içeren bir değişken fields mevcut; bu, yazdırılacak tahmin alanlarını belirtmek için kullanılır.
Bu egzersiz, kursun bir parçasıdır
Python ile Spark SQL'e Giriş
Egzersiz talimatları
- Modeli
df_testsetiçindeki verilere uygula. - Tahmin etiketle eşleşmiyorsa "incorrect" yazdır.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Apply the model to the test data
predictions = df_fitted.____(____).select(fields)
# Print incorrect if prediction does not match label
for x in predictions.take(8):
print()
if x.label != int(x.____):
print("INCORRECT ==> ")
for y in fields:
print(y,":", x[y])