MulaiMulai sekarang secara gratis

Scatter matrix untuk kolom numerik

Anda telah menelusuri data pasar tani yang baru, dan ternyata bentuknya cukup lebar – terdapat banyak kolom informasi untuk setiap baris pasar. Alih-alih memeriksa satu per satu setiap kombinasi kolom numerik dan membuat scatter plot untuk melihat korelasi, Anda memutuskan untuk membuat scatter matrix menggunakan fungsi bawaan pandas.

Meningkatkan ukuran figur dengan argumen figsize akan membantu memberikan ruang bernapas pada visualisasi yang padat. Karena akan ada banyak tumpang tindih titik, menurunkan opasitas titik akan membantu menampilkan kerapatan area tumpang tindih tersebut.

Latihan ini adalah bagian dari kursus

Meningkatkan Visualisasi Data Anda di Python

Lihat Kursus

Petunjuk latihan

  • Ambil subset kolom DataFrame markets menjadi numeric_columns agar scatter matrix hanya menampilkan kolom numerik non-biner.
  • Tingkatkan ukuran figur menjadi 15 kali 10 untuk menghindari penumpukan.
  • Kurangi opasitas titik menjadi 50% untuk menonjolkan area yang saling tumpang tindih.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Select just the numeric columns (exluding individual goods)
numeric_columns = ['lat', 'lon', 'months_open', 'num_items_sold', 'state_pop']

# Make a scatter matrix of numeric columns
pd.plotting.scatter_matrix(markets[____], 
                             # Make figure large to show details
                             figsize = ____, 
                           # Lower point opacity to show overlap
                           alpha = ____)

plt.show()
Edit dan Jalankan Kode