Beispiel zu when()
Mit der when()-Klausel kannst du einen DataFrame abhängig von seinem Inhalt bedingt verändern. Du sollst unseren DataFrame voter_df so anpassen, dass für jedes stimmberechtigte Mitglied mit der Bezeichnung "Councilmember" eine Zufallszahl hinzugefügt wird.
Der DataFrame voter_df ist definiert und steht dir zur Verfügung. Die Bibliothek pyspark.sql.functions ist als F. verfügbar. Du kannst F.rand() verwenden, um den Zufallswert zu erzeugen.
Diese Übung ist Teil des Kurses
Datenbereinigung mit PySpark
Anleitung zur Übung
- Füge
voter_dfeine Spalte namensrandom_valhinzu, die für alle Wählerinnen und Wähler mit dem Titel Councilmember das Ergebnis der MethodeF.rand()enthält. - Zeige einige Zeilen des DataFrames an und prüfe, ob die
.when()-Klausel funktioniert hat.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Add a column to voter_df for any voter with the title **Councilmember**
voter_df = voter_df.____('random_val',
____(____, ____))
# Show some of the DataFrame rows, noting whether the when clause worked
voter_df.____