Aan de slagGa gratis aan de slag

Voorspel testgegevens

Een getraind logistiek model df_fitted is beschikbaar. Er is een dataframe df_testset met testgegevens voor dit model. Een variabele fields is beschikbaar met de lijst ['prediction', 'label', 'endword', 'doc', 'probability']; deze wordt gebruikt om aan te geven welke predictievelden je wilt afdrukken.

Deze oefening maakt deel uit van de cursus

Introductie tot Spark SQL in Python

Cursus bekijken

Oefeninstructies

  • Pas het model toe op de gegevens in df_testset.
  • Print "incorrect" als de voorspelling niet overeenkomt met het label.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Apply the model to the test data
predictions = df_fitted.____(____).select(fields)

# Print incorrect if prediction does not match label
for x in predictions.take(8):
    print()
    if x.label != int(x.____):
        print("INCORRECT ==> ")
    for y in fields:
        print(y,":", x[y])
Code bewerken en uitvoeren