LoslegenKostenlos starten

Beispiel zu when()

Mit der when()-Klausel kannst du einen DataFrame abhängig von seinem Inhalt bedingt verändern. Du sollst unseren DataFrame voter_df so anpassen, dass für jedes stimmberechtigte Mitglied mit der Bezeichnung "Councilmember" eine Zufallszahl hinzugefügt wird.

Der DataFrame voter_df ist definiert und steht dir zur Verfügung. Die Bibliothek pyspark.sql.functions ist als F. verfügbar. Du kannst F.rand() verwenden, um den Zufallswert zu erzeugen.

Diese Übung ist Teil des Kurses

<Kurs>Datenbereinigung mit PySpark</Kurs>
Kurs ansehen

Übungsanweisungen

  • Füge voter_df eine Spalte namens random_val hinzu, die für alle Wählerinnen und Wähler mit dem Titel Councilmember das Ergebnis der Methode F.rand() enthält.
  • Zeige einige Zeilen des DataFrames an und prüfe, ob die .when()-Klausel funktioniert hat.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Add a column to voter_df for any voter with the title **Councilmember**
voter_df = voter_df.____('random_val',
                               ____(____, ____))

# Show some of the DataFrame rows, noting whether the when clause worked
voter_df.____
Code bearbeiten und ausführen