1. Nauka
  2. /
  3. Kursy
  4. /
  5. Czyszczenie danych w PySpark

Connected

ćwiczenie

Przykład użycia when()

Klauzula when() pozwala na warunkowe modyfikowanie DataFrame na podstawie jego zawartości. Zmodyfikuj DataFrame voter_df, dodając losową liczbę dla każdego członka głosującego z tytułem „Councilmember".

DataFrame voter_df jest już zdefiniowany i dostępny. Biblioteka pyspark.sql.functions jest dostępna jako F. Do wygenerowania losowej wartości użyj metody F.rand().

Instrukcje

100 XP
  • Dodaj do voter_df kolumnę o nazwie random_val z wynikami metody F.rand() dla każdego wyborcy z tytułem Councilmember.
  • Wyświetl kilka wierszy DataFrame i sprawdź, czy klauzula .when() zadziałała poprawnie.