LoslegenKostenlos loslegen

Testdaten vorhersagen

Ein angepasstes logistisches Modell df_fitted ist verfügbar. Ein DataFrame df_testset mit Testdaten für dieses Modell ist vorhanden. Eine Variable fields ist verfügbar und enthält die Liste ['prediction', 'label', 'endword', 'doc', 'probability']; sie wird verwendet, um festzulegen, welche Vorhersagefelder ausgegeben werden sollen.

Diese Übung ist Teil des Kurses

Einführung in Spark SQL mit Python

Kurs anzeigen

Anleitung zur Übung

  • Wende das Modell auf die Daten in df_testset an.
  • Gib "incorrect" aus, wenn die Vorhersage nicht zum Label passt.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Apply the model to the test data
predictions = df_fitted.____(____).select(fields)

# Print incorrect if prediction does not match label
for x in predictions.take(8):
    print()
    if x.label != int(x.____):
        print("INCORRECT ==> ")
    for y in fields:
        print(y,":", x[y])
Code bearbeiten und ausführen