Aan de slagGa gratis aan de slag

when()-voorbeeld

Met de when()-clausule kun je een DataFrame conditioneel aanpassen op basis van de inhoud. Je gaat ons voter_df-DataFrame aanpassen door een willekeurig getal toe te voegen aan elke kiezer die de functie "Councilmember" heeft.

Het voter_df-DataFrame is gedefinieerd en beschikbaar. De bibliotheek pyspark.sql.functions is beschikbaar als F. Je kunt F.rand() gebruiken om de willekeurige waarde te genereren.

Deze oefening maakt deel uit van de cursus

Data opschonen met PySpark

Cursus bekijken

Oefeninstructies

  • Voeg een kolom toe aan voter_df met de naam random_val met de uitkomst van de methode F.rand() voor elke kiezer met de titel Councilmember.
  • Toon een aantal rijen van het DataFrame en controleer of de .when()-clausule werkte.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Add a column to voter_df for any voter with the title **Councilmember**
voter_df = voter_df.____('random_val',
                               ____(____, ____))

# Show some of the DataFrame rows, noting whether the when clause worked
voter_df.____
Code bewerken en uitvoeren