Voorspel testgegevens
Een getraind logistiek model df_fitted is beschikbaar. Er is een dataframe df_testset met testgegevens voor dit model. Een variabele fields is beschikbaar met de lijst ['prediction', 'label', 'endword', 'doc', 'probability']; deze wordt gebruikt om aan te geven welke predictievelden je wilt afdrukken.
Deze oefening maakt deel uit van de cursus
Introductie tot Spark SQL in Python
Oefeninstructies
- Pas het model toe op de gegevens in
df_testset. - Print "incorrect" als de voorspelling niet overeenkomt met het label.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Apply the model to the test data
predictions = df_fitted.____(____).select(fields)
# Print incorrect if prediction does not match label
for x in predictions.take(8):
print()
if x.label != int(x.____):
print("INCORRECT ==> ")
for y in fields:
print(y,":", x[y])