ejemplo de when()
La cláusula when() te permite modificar condicionalmente un Marco de Datos en función de su contenido. Querrás modificar nuestro voter_df DataFrame para añadir un número aleatorio a cualquier miembro votante que se defina como "Miembro del Consejo".
El voter_df DataFrame está definido y a tu disposición. La biblioteca pyspark.sql.functions está disponible como F.. Puedes utilizar F.rand() para generar el valor aleatorio.
Este ejercicio forma parte del curso
Limpiar datos con PySpark
Instrucciones del ejercicio
- Añade una columna a
voter_dfllamadarandom_valcon los resultados del métodoF.rand()para cualquier votante con el título de Concejal. - Muestra algunas de las filas del DataFrame, observando si la cláusula
.when()ha funcionado.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Add a column to voter_df for any voter with the title **Councilmember**
voter_df = voter_df.____('random_val',
____(____, ____))
# Show some of the DataFrame rows, noting whether the when clause worked
voter_df.____