LoslegenKostenlos loslegen

when()-Beispiel

Mit der when() Klausel kannst du einen Datenrahmen auf der Grundlage seines Inhalts bedingt verändern. Du musst unseren voter_df DataFrame ändern, um jedem stimmberechtigten Mitglied, das als "Ratsmitglied" definiert ist, eine Zufallszahl hinzuzufügen.

Der voter_df DataFrame ist definiert und steht dir zur Verfügung. Die Bibliothek pyspark.sql.functions ist als F. verfügbar. Du kannst F.rand() verwenden, um den Zufallswert zu erzeugen.

Diese Übung ist Teil des Kurses

Daten bereinigen mit PySpark

Kurs anzeigen

Anleitung zur Übung

  • Füge eine Spalte mit dem Namen random_val zu voter_df hinzu, die die Ergebnisse der Methode F.rand() für alle Wähler mit dem Titel Ratsmitglied enthält.
  • Zeige einige der DataFrame-Zeilen und notiere, ob die .when() Klausel funktioniert hat.

Interaktive Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Add a column to voter_df for any voter with the title **Councilmember**
voter_df = voter_df.____('random_val',
                               ____(____, ____))

# Show some of the DataFrame rows, noting whether the when clause worked
voter_df.____
Code bearbeiten und ausführen