Scatter matrix untuk kolom numerik
Anda telah menelusuri data pasar tani yang baru, dan ternyata bentuknya cukup lebar – terdapat banyak kolom informasi untuk setiap baris pasar. Alih-alih memeriksa satu per satu setiap kombinasi kolom numerik dan membuat scatter plot untuk melihat korelasi, Anda memutuskan untuk membuat scatter matrix menggunakan fungsi bawaan pandas.
Meningkatkan ukuran figur dengan argumen figsize akan membantu memberikan ruang bernapas pada visualisasi yang padat. Karena akan ada banyak tumpang tindih titik, menurunkan opasitas titik akan membantu menampilkan kerapatan area tumpang tindih tersebut.
Latihan ini merupakan bagian dari kursus
Meningkatkan Visualisasi Data Anda di Python
Instruksi latihan
- Ambil subset kolom DataFrame
marketsmenjadinumeric_columnsagar scatter matrix hanya menampilkan kolom numerik non-biner. - Tingkatkan ukuran figur menjadi
15kali10untuk menghindari penumpukan. - Kurangi opasitas titik menjadi 50% untuk menonjolkan area yang saling tumpang tindih.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Select just the numeric columns (exluding individual goods)
numeric_columns = ['lat', 'lon', 'months_open', 'num_items_sold', 'state_pop']
# Make a scatter matrix of numeric columns
pd.plotting.scatter_matrix(markets[____],
# Make figure large to show details
figsize = ____,
# Lower point opacity to show overlap
alpha = ____)
plt.show()