when()-voorbeeld
Met de when()-clausule kun je een DataFrame conditioneel aanpassen op basis van de inhoud. Je gaat ons voter_df-DataFrame aanpassen door een willekeurig getal toe te voegen aan elke kiezer die de functie "Councilmember" heeft.
Het voter_df-DataFrame is gedefinieerd en beschikbaar. De bibliotheek pyspark.sql.functions is beschikbaar als F. Je kunt F.rand() gebruiken om de willekeurige waarde te genereren.
Deze oefening maakt deel uit van de cursus
Data opschonen met PySpark
Oefeninstructies
- Voeg een kolom toe aan
voter_dfmet de naamrandom_valmet de uitkomst van de methodeF.rand()voor elke kiezer met de titel Councilmember. - Toon een aantal rijen van het DataFrame en controleer of de
.when()-clausule werkte.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Add a column to voter_df for any voter with the title **Councilmember**
voter_df = voter_df.____('random_val',
____(____, ____))
# Show some of the DataFrame rows, noting whether the when clause worked
voter_df.____