Testdaten vorhersagen
Ein angepasstes logistisches Modell df_fitted ist verfügbar. Ein DataFrame df_testset mit Testdaten für dieses Modell ist vorhanden. Eine Variable fields ist verfügbar und enthält die Liste ['prediction', 'label', 'endword', 'doc', 'probability']; sie wird verwendet, um festzulegen, welche Vorhersagefelder ausgegeben werden sollen.
Diese Übung ist Teil des Kurses
Einführung in Spark SQL mit Python
Anleitung zur Übung
- Wende das Modell auf die Daten in
df_testsetan. - Gib "incorrect" aus, wenn die Vorhersage nicht zum Label passt.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Apply the model to the test data
predictions = df_fitted.____(____).select(fields)
# Print incorrect if prediction does not match label
for x in predictions.take(8):
print()
if x.label != int(x.____):
print("INCORRECT ==> ")
for y in fields:
print(y,":", x[y])