Mulai sekarangMulai gratis

Visualisasi PySpark DataFrame

Representasi grafis atau visualisasi data sangat penting untuk memahami sekaligus menafsirkan data. Dalam latihan visualisasi data sederhana ini, Anda akan terlebih dahulu mencetak nama-nama kolom dari DataFrame names_df yang telah Anda buat sebelumnya, kemudian mengonversi names_df menjadi DataFrame Pandas, dan akhirnya memplot isinya sebagai bagan batang horizontal dengan nama orang pada sumbu x dan usia mereka pada sumbu y.

Ingat, Anda sudah memiliki SparkSession spark dan DataFrame names_df yang tersedia di ruang kerja Anda.

Latihan ini merupakan bagian dari kursus

Fundamental Big Data dengan PySpark

Lihat Kursus

Instruksi latihan

  • Cetak nama-nama kolom dalam DataFrame names_df.
  • Konversi DataFrame names_df menjadi DataFrame Pandas df_pandas.
  • Gunakan metode plot() dari matplotlib untuk membuat bagan batang horizontal dengan 'Name' pada sumbu x dan 'Age' pada sumbu y.

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

# Check the column names of names_df
print("The column names of names_df are", names_df.____)

# Convert to Pandas DataFrame  
df_pandas = names_df.____()

# Create a horizontal bar plot
____.plot(kind='barh', x='____', y='____', colormap='winter_r')
plt.show()
Edit dan Jalankan Kode