ComenzarEmpieza gratis

Predecir datos de prueba

Tienes disponible un modelo logístico ajustado df_fitted. También hay un dataframe df_testset con datos de prueba para este modelo. Hay una variable fields disponible, que contiene la lista ['prediction', 'label', 'endword', 'doc', 'probability']; se utiliza para especificar qué campos de predicción imprimir.

Este ejercicio forma parte del curso

Introducción a Spark SQL en Python

Ver curso

Instrucciones del ejercicio

  • Aplica el modelo a los datos en df_testset.
  • Imprime "incorrect" si la predicción no coincide con la etiqueta.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Apply the model to the test data
predictions = df_fitted.____(____).select(fields)

# Print incorrect if prediction does not match label
for x in predictions.take(8):
    print()
    if x.label != int(x.____):
        print("INCORRECT ==> ")
    for y in fields:
        print(y,":", x[y])
Editar y ejecutar código