Pandas UDFs
Este ejercicio trata sobre las pandas UDFs, para que practiques su sintaxis. Mientras lo resuelves, fíjate en las diferencias entre la UDF de PySpark del ejercicio anterior y este tipo de UDF.
Recuerda que ya tienes una SparkSession llamada spark en tu espacio de trabajo.
Este ejercicio forma parte del curso
Introducción a PySpark
Instrucciones del ejercicio
- Define la función
add_ten_pandas()como una pandas UDF. - Añade una columna nueva al DataFrame llamada
"10_plus"que aplique la pandas UDF a la columna"value"dedf. - Muestra el DataFrame resultante.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Define a Pandas UDF that adds 10 to each element in a vectorized way
@____(DoubleType())
def add_ten_pandas(column):
return column + 10
# Apply the UDF and show the result
df.withColumn("10_plus", ____)
df.____