when()-Beispiel
Mit der when() Klausel kannst du einen Datenrahmen auf der Grundlage seines Inhalts bedingt verändern. Du musst unseren voter_df DataFrame ändern, um jedem stimmberechtigten Mitglied, das als "Ratsmitglied" definiert ist, eine Zufallszahl hinzuzufügen.
Der voter_df DataFrame ist definiert und steht dir zur Verfügung. Die Bibliothek pyspark.sql.functions ist als F. verfügbar. Du kannst F.rand() verwenden, um den Zufallswert zu erzeugen.
Diese Übung ist Teil des Kurses
Daten bereinigen mit PySpark
Anleitung zur Übung
- Füge eine Spalte mit dem Namen
random_valzuvoter_dfhinzu, die die Ergebnisse der MethodeF.rand()für alle Wähler mit dem Titel Ratsmitglied enthält. - Zeige einige der DataFrame-Zeilen und notiere, ob die
.when()Klausel funktioniert hat.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Add a column to voter_df for any voter with the title **Councilmember**
voter_df = voter_df.____('random_val',
____(____, ____))
# Show some of the DataFrame rows, noting whether the when clause worked
voter_df.____