Predecir datos de prueba
Tienes disponible un modelo logístico ajustado df_fitted. También hay un dataframe df_testset con datos de prueba para este modelo. Hay una variable fields disponible, que contiene la lista ['prediction', 'label', 'endword', 'doc', 'probability']; se utiliza para especificar qué campos de predicción imprimir.
Este ejercicio forma parte del curso
Introducción a Spark SQL en Python
Instrucciones del ejercicio
- Aplica el modelo a los datos en
df_testset. - Imprime "incorrect" si la predicción no coincide con la etiqueta.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Apply the model to the test data
predictions = df_fitted.____(____).select(fields)
# Print incorrect if prediction does not match label
for x in predictions.take(8):
print()
if x.label != int(x.____):
print("INCORRECT ==> ")
for y in fields:
print(y,":", x[y])