When / Otherwise
Bu gereksinim sonuncusuna benzer, ancak şimdi seçmenin konumuna göre birden fazla değer eklemek istiyorsun. voter_df DataFrame'ini değiştirerek, unvanı Councilmember olan her oy kullanma yetkisine sahip üyenin değerine rastgele bir sayı ekle. Mayor için 2, diğer tüm pozisyonlar için 0 kullan.
voter_df Data Frame'i tanımlı ve kullanımına hazır. pyspark.sql.functions kütüphanesi F. olarak mevcut. Rastgele değer üretmek için F.rand() kullanabilirsin.
Bu egzersiz
PySpark ile Veri Temizleme
kursunun bir parçasıdırEgzersiz talimatları
- Councilmember unvanına sahip her seçmen için
F.rand()metodunun sonucunu içerenrandom_valadlı bir sütunuvoter_df'e ekle. Mayor içinrandom_valdeğerini 2 yap. Diğer tüm unvanlar için değeri 0 yap. - Yan tümcelerin çalışıp çalışmadığını görmek için Data Frame satırlarının bir kısmını göster.
random_valiçinde 0'ı bulmak için.filteryan tümcesini kullan.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Add a column to voter_df for a voter based on their position
voter_df = voter_df.____('random_val',
when(voter_df.TITLE == 'Councilmember', ____)
.____(____, 2)
____
# Show some of the DataFrame rows
voter_df.show()
# Use the .filter() clause with random_val
voter_df.____(____).show()