ComeçarComece de graça

Prever dados de teste

Um modelo logístico ajustado df_fitted está disponível. Um dataframe df_testset está disponível contendo dados de teste para esse modelo. Uma variável fields está disponível, contendo a lista ['prediction', 'label', 'endword', 'doc', 'probability']; ela é usada para especificar quais campos de previsão devem ser impressos.

Este exercício faz parte do curso

Introdução ao Spark SQL em Python

Ver curso

Instruções do exercício

  • Aplique o modelo aos dados em df_testset.
  • Imprima "incorrect" se a previsão não corresponder ao rótulo.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Apply the model to the test data
predictions = df_fitted.____(____).select(fields)

# Print incorrect if prediction does not match label
for x in predictions.take(8):
    print()
    if x.label != int(x.____):
        print("INCORRECT ==> ")
    for y in fields:
        print(y,":", x[y])
Editar e executar o código