Beispiel zu when()
Mit der when()-Klausel kannst du einen DataFrame abhängig von seinem Inhalt bedingt verändern. Du sollst unseren DataFrame voter_df so anpassen, dass für jedes stimmberechtigte Mitglied mit der Bezeichnung "Councilmember" eine Zufallszahl hinzugefügt wird.
Der DataFrame voter_df ist definiert und steht dir zur Verfügung. Die Bibliothek pyspark.sql.functions ist als F. verfügbar. Du kannst F.rand() verwenden, um den Zufallswert zu erzeugen.
Diese Übung ist Teil des Kurses
<Kurs>Datenbereinigung mit PySpark</Kurs>Übungsanweisungen
- Füge
voter_dfeine Spalte namensrandom_valhinzu, die für alle Wählerinnen und Wähler mit dem Titel Councilmember das Ergebnis der MethodeF.rand()enthält. - Zeige einige Zeilen des DataFrames an und prüfe, ob die
.when()-Klausel funktioniert hat.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Add a column to voter_df for any voter with the title **Councilmember**
voter_df = voter_df.____('random_val',
____(____, ____))
# Show some of the DataFrame rows, noting whether the when clause worked
voter_df.____