1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Cleaning Data with PySpark

Connected

cvičení

Příklad with when()

Klauzule when() ti umožňuje podmíněně upravit DataFrame podle jeho obsahu. Přidáš do DataFramu voter_df náhodné číslo pro každého člena hlasování, který má titul "Councilmember".

DataFrame voter_df je již definovaný a máš ho k dispozici. Knihovna pyspark.sql.functions je dostupná jako F. Pro vygenerování náhodné hodnoty použij F.rand().

Pokyny

100 XP
  • Přidej do voter_df sloupec random_val s výsledky metody F.rand() pro každého voliče s titulem Councilmember.
  • Zobraz několik řádků DataFramu a ověř, jestli klauzule .when() fungovala správně.