Scatter matrix untuk kolom numerik
Anda telah menelusuri data pasar tani yang baru, dan ternyata bentuknya cukup lebar – terdapat banyak kolom informasi untuk setiap baris pasar. Alih-alih memeriksa satu per satu setiap kombinasi kolom numerik dan membuat scatter plot untuk melihat korelasi, Anda memutuskan untuk membuat scatter matrix menggunakan fungsi bawaan pandas.
Meningkatkan ukuran figur dengan argumen figsize akan membantu memberikan ruang bernapas pada visualisasi yang padat. Karena akan ada banyak tumpang tindih titik, menurunkan opasitas titik akan membantu menampilkan kerapatan area tumpang tindih tersebut.
Latihan ini adalah bagian dari kursus
Meningkatkan Visualisasi Data Anda di Python
Petunjuk latihan
- Ambil subset kolom DataFrame
marketsmenjadinumeric_columnsagar scatter matrix hanya menampilkan kolom numerik non-biner. - Tingkatkan ukuran figur menjadi
15kali10untuk menghindari penumpukan. - Kurangi opasitas titik menjadi 50% untuk menonjolkan area yang saling tumpang tindih.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Select just the numeric columns (exluding individual goods)
numeric_columns = ['lat', 'lon', 'months_open', 'num_items_sold', 'state_pop']
# Make a scatter matrix of numeric columns
pd.plotting.scatter_matrix(markets[____],
# Make figure large to show details
figsize = ____,
# Lower point opacity to show overlap
alpha = ____)
plt.show()