when()-Beispiel
Mit der when()
Klausel kannst du einen Datenrahmen auf der Grundlage seines Inhalts bedingt verändern. Du musst unseren voter_df
DataFrame ändern, um jedem stimmberechtigten Mitglied, das als "Ratsmitglied" definiert ist, eine Zufallszahl hinzuzufügen.
Der voter_df
DataFrame ist definiert und steht dir zur Verfügung. Die Bibliothek pyspark.sql.functions
ist als F.
verfügbar. Du kannst F.rand()
verwenden, um den Zufallswert zu erzeugen.
Diese Übung ist Teil des Kurses
Daten bereinigen mit PySpark
Anleitung zur Übung
- Füge eine Spalte mit dem Namen
random_val
zuvoter_df
hinzu, die die Ergebnisse der MethodeF.rand()
für alle Wähler mit dem Titel Ratsmitglied enthält. - Zeige einige der DataFrame-Zeilen und notiere, ob die
.when()
Klausel funktioniert hat.
Interaktive Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Add a column to voter_df for any voter with the title **Councilmember**
voter_df = voter_df.____('random_val',
____(____, ____))
# Show some of the DataFrame rows, noting whether the when clause worked
voter_df.____