BaşlayınÜcretsiz Başlayın

When / Otherwise

Bu gereksinim sonuncusuna benzer, ancak şimdi seçmenin konumuna göre birden fazla değer eklemek istiyorsun. voter_df DataFrame'ini değiştirerek, unvanı Councilmember olan her oy kullanma yetkisine sahip üyenin değerine rastgele bir sayı ekle. Mayor için 2, diğer tüm pozisyonlar için 0 kullan.

voter_df Data Frame'i tanımlı ve kullanımına hazır. pyspark.sql.functions kütüphanesi F. olarak mevcut. Rastgele değer üretmek için F.rand() kullanabilirsin.

Bu egzersiz

PySpark ile Veri Temizleme

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • Councilmember unvanına sahip her seçmen için F.rand() metodunun sonucunu içeren random_val adlı bir sütunu voter_df'e ekle. Mayor için random_val değerini 2 yap. Diğer tüm unvanlar için değeri 0 yap.
  • Yan tümcelerin çalışıp çalışmadığını görmek için Data Frame satırlarının bir kısmını göster.
  • random_val içinde 0'ı bulmak için .filter yan tümcesini kullan.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Add a column to voter_df for a voter based on their position
voter_df = voter_df.____('random_val',
                               when(voter_df.TITLE == 'Councilmember', ____)
                               .____(____, 2)
                               ____

# Show some of the DataFrame rows
voter_df.show()

# Use the .filter() clause with random_val
voter_df.____(____).show()
Kodu Düzenle ve Çalıştır