ComenzarEmpieza gratis

Pandas UDFs

Este ejercicio trata sobre las pandas UDFs, para que practiques su sintaxis. Mientras lo resuelves, fíjate en las diferencias entre la UDF de PySpark del ejercicio anterior y este tipo de UDF.

Recuerda que ya tienes una SparkSession llamada spark en tu espacio de trabajo.

Este ejercicio forma parte del curso

Introducción a PySpark

Ver curso

Instrucciones del ejercicio

  • Define la función add_ten_pandas() como una pandas UDF.
  • Añade una columna nueva al DataFrame llamada "10_plus" que aplique la pandas UDF a la columna "value" de df.
  • Muestra el DataFrame resultante.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Define a Pandas UDF that adds 10 to each element in a vectorized way
@____(DoubleType())
def add_ten_pandas(column):
    return column + 10

# Apply the UDF and show the result
df.withColumn("10_plus", ____)
df.____
Editar y ejecutar código