Sayısal sütunların saçılım matrisi
Yeni çiftçi pazarı verilerini inceledin ve veri epey geniş – her pazar satırı için birçok sütun var. Sayısal sütunların her kombinasyonunu tek tek inceleyip korelasyonları görmek için saçılım grafikleri çizmek yerine, pandas'ın yerleşik fonksiyonunu kullanarak bir saçılım matrisi yapmaya karar verdin.
Yoğun görselleştirmeye biraz nefes aldırmak için figsize argümanıyla şekil boyutunu büyütmek iyi olur. Noktalarda ciddi örtüşmeler olacağından, nokta saydamlığını azaltmak bu örtüşmelerin yoğunluğunu göstermeye yardımcı olur.
Bu egzersiz
Python'da Veri Görselleştirmelerini İyileştirme
kursunun bir parçasıdırEgzersiz talimatları
- Saçılım matrisi yalnızca sayısal ve ikili olmayan sütunları göstersin diye
marketsDataFrame'inin sütunlarınınumeric_columnsile alt kümele. - Kalabalığı önlemek için şekil boyutunu
15x10olacak şekilde artır. - Örtüşen bölgeleri göstermek için nokta saydamlığını %50'ye düşür.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Select just the numeric columns (exluding individual goods)
numeric_columns = ['lat', 'lon', 'months_open', 'num_items_sold', 'state_pop']
# Make a scatter matrix of numeric columns
pd.plotting.scatter_matrix(markets[____],
# Make figure large to show details
figsize = ____,
# Lower point opacity to show overlap
alpha = ____)
plt.show()