ejemplo de when()
La cláusula when()
te permite modificar condicionalmente un Marco de Datos en función de su contenido. Querrás modificar nuestro voter_df
DataFrame para añadir un número aleatorio a cualquier miembro votante que se defina como "Miembro del Consejo".
El voter_df
DataFrame está definido y a tu disposición. La biblioteca pyspark.sql.functions
está disponible como F.
. Puedes utilizar F.rand()
para generar el valor aleatorio.
Este ejercicio forma parte del curso
Limpiar datos con PySpark
Instrucciones de ejercicio
- Añade una columna a
voter_df
llamadarandom_val
con los resultados del métodoF.rand()
para cualquier votante con el título de Concejal. - Muestra algunas de las filas del DataFrame, observando si la cláusula
.when()
ha funcionado.
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# Add a column to voter_df for any voter with the title **Councilmember**
voter_df = voter_df.____('random_val',
____(____, ____))
# Show some of the DataFrame rows, noting whether the when clause worked
voter_df.____