Sayısal sütunların saçılım matrisi
Yeni çiftçi pazarı verilerini inceledin ve veri epey geniş – her pazar satırı için birçok sütun var. Sayısal sütunların her kombinasyonunu tek tek inceleyip korelasyonları görmek için saçılım grafikleri çizmek yerine, pandas'ın yerleşik fonksiyonunu kullanarak bir saçılım matrisi yapmaya karar verdin.
Yoğun görselleştirmeye biraz nefes aldırmak için figsize argümanıyla şekil boyutunu büyütmek iyi olur. Noktalarda ciddi örtüşmeler olacağından, nokta saydamlığını azaltmak bu örtüşmelerin yoğunluğunu göstermeye yardımcı olur.
Bu egzersiz, kursun bir parçasıdır
Python'da Veri Görselleştirmelerini İyileştirme
Egzersiz talimatları
- Saçılım matrisi yalnızca sayısal ve ikili olmayan sütunları göstersin diye
marketsDataFrame'inin sütunlarınınumeric_columnsile alt kümele. - Kalabalığı önlemek için şekil boyutunu
15x10olacak şekilde artır. - Örtüşen bölgeleri göstermek için nokta saydamlığını %50'ye düşür.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Select just the numeric columns (exluding individual goods)
numeric_columns = ['lat', 'lon', 'months_open', 'num_items_sold', 'state_pop']
# Make a scatter matrix of numeric columns
pd.plotting.scatter_matrix(markets[____],
# Make figure large to show details
figsize = ____,
# Lower point opacity to show overlap
alpha = ____)
plt.show()