PySpark DataFrame görselleştirme
Verilerin grafiksel gösterimi ya da görselleştirilmesi, veriyi anlamak ve yorumlamak için çok önemlidir. Bu basit veri görselleştirme egzersizinde, önce daha önce oluşturduğun names_df DataFrame'inin sütun adlarını yazdıracak, ardından names_df'i bir Pandas DataFrame'ine dönüştürecek ve son olarak içeriği x ekseninde kişilerin adları, y ekseninde yaşları olacak şekilde yatay çubuk grafik olarak çizeceksin.
Unutma, çalışma alanında hazır bir SparkSession spark ve bir DataFrame names_df bulunuyor.
Bu egzersiz
PySpark ile Big Data Temelleri
kursunun bir parçasıdırEgzersiz talimatları
names_dfDataFrame'inin sütun adlarını yazdır.names_dfDataFrame'inidf_pandasadlı bir Pandas DataFrame'ine dönüştür.- matplotlib'in
plot()yöntemini kullanarak x ekseninde'Name', y ekseninde'Age'olacak şekilde yatay bir çubuk grafik oluştur.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Check the column names of names_df
print("The column names of names_df are", names_df.____)
# Convert to Pandas DataFrame
df_pandas = names_df.____()
# Create a horizontal bar plot
____.plot(kind='barh', x='____', y='____', colormap='winter_r')
plt.show()