BaşlayınÜcretsiz Başlayın

PySpark DataFrame görselleştirme

Verilerin grafiksel gösterimi ya da görselleştirilmesi, veriyi anlamak ve yorumlamak için çok önemlidir. Bu basit veri görselleştirme egzersizinde, önce daha önce oluşturduğun names_df DataFrame'inin sütun adlarını yazdıracak, ardından names_df'i bir Pandas DataFrame'ine dönüştürecek ve son olarak içeriği x ekseninde kişilerin adları, y ekseninde yaşları olacak şekilde yatay çubuk grafik olarak çizeceksin.

Unutma, çalışma alanında hazır bir SparkSession spark ve bir DataFrame names_df bulunuyor.

Bu egzersiz

PySpark ile Big Data Temelleri

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • names_df DataFrame'inin sütun adlarını yazdır.
  • names_df DataFrame'ini df_pandas adlı bir Pandas DataFrame'ine dönüştür.
  • matplotlib'in plot() yöntemini kullanarak x ekseninde 'Name', y ekseninde 'Age' olacak şekilde yatay bir çubuk grafik oluştur.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Check the column names of names_df
print("The column names of names_df are", names_df.____)

# Convert to Pandas DataFrame  
df_pandas = names_df.____()

# Create a horizontal bar plot
____.plot(kind='barh', x='____', y='____', colormap='winter_r')
plt.show()
Kodu Düzenle ve Çalıştır