IniziaInizia gratis

Predici i dati di test

È disponibile un modello logistico adattato df_fitted. È disponibile un dataframe df_testset che contiene i dati di test per questo modello. È disponibile una variabile fields, che contiene l'elenco ['prediction', 'label', 'endword', 'doc', 'probability']; questa viene usata per specificare quali campi di previsione stampare.

Questo esercizio fa parte del corso

Introduzione a Spark SQL in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Applica il modello ai dati in df_testset.
  • Stampa "incorrect" se la previsione non corrisponde all'etichetta.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Apply the model to the test data
predictions = df_fitted.____(____).select(fields)

# Print incorrect if prediction does not match label
for x in predictions.take(8):
    print()
    if x.label != int(x.____):
        print("INCORRECT ==> ")
    for y in fields:
        print(y,":", x[y])
Modifica ed esegui il codice