ComenzarEmpieza gratis

ejemplo de when()

La cláusula when() te permite modificar condicionalmente un Marco de Datos en función de su contenido. Querrás modificar nuestro voter_df DataFrame para añadir un número aleatorio a cualquier miembro votante que se defina como "Miembro del Consejo".

El voter_df DataFrame está definido y a tu disposición. La biblioteca pyspark.sql.functions está disponible como F.. Puedes utilizar F.rand() para generar el valor aleatorio.

Este ejercicio forma parte del curso

Limpiar datos con PySpark

Ver curso

Instrucciones de ejercicio

  • Añade una columna a voter_df llamada random_val con los resultados del método F.rand() para cualquier votante con el título de Concejal.
  • Muestra algunas de las filas del DataFrame, observando si la cláusula .when() ha funcionado.

Ejercicio interactivo práctico

Pruebe este ejercicio completando este código de muestra.

# Add a column to voter_df for any voter with the title **Councilmember**
voter_df = voter_df.____('random_val',
                               ____(____, ____))

# Show some of the DataFrame rows, noting whether the when clause worked
voter_df.____
Editar y ejecutar código