%90, %95 ve %99 aralıkları

Alaska, Fairbanks’te bir açık hava macera şirketinde veri bilimcisin. Son zamanlarda müşteriler SO₂ kirliliğiyle ilgili sorunlar yaşıyor ve bu da maliyetli iptallere yol açıyor. Şirketin CO, NO₂ ve O₃ için sensörleri var, ancak SO₂ seviyeleri için yok.

Sensörleri olan kirleticilerin değerlerine göre SO₂ değerlerini tahmin eden bir model kurdun (pollution_model olarak yüklenen bir statsmodels nesnesi). Modelinin SO₂ tahmininde hangi kirleticinin değerinin en büyük etkiye sahip olduğunu araştırmak istiyorsun. Bu, açık hava turları planlarken hangi kirleticinin değerlerine en çok dikkat etmen gerektiğini bilmene yardımcı olacak. Raporundaki bilgi miktarını en üst düzeye çıkarmak için model tahminleri için birden fazla belirsizlik düzeyi göster.

Bu egzersiz, kursun bir parçasıdır

Python'da Veri Görselleştirmelerini İyileştirme

Kursa Göz Atın

Egzersiz talimatları

alpha listesindeki değerlere göre uygun aralık genişliği yüzdelerini (%.90, %.95 ve %.99’dan) doldur.
For döngüsünde, aralığı atanan color ile renklendir.
Göstergeyi etiketlemek için döngünün width yüzde değerini plt.hlines() fonksiyonuna geçir.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Add interval percent widths
alphas = [     0.01,  0.05,   0.1] 
widths = [ '__% CI', '__%', '__%']
colors = ['#fee08b','#fc8d59','#d53e4f']

for alpha, color, width in zip(alphas, colors, widths):
    # Grab confidence interval
    conf_ints = pollution_model.conf_int(alpha)
    
    # Pass current interval color and legend label to plot
    plt.hlines(y = conf_ints.index, xmin = conf_ints[0], xmax = conf_ints[1],
               colors = ____, ____ = width, linewidth = 10) 

# Draw point estimates
plt.plot(pollution_model.params, pollution_model.params.index, 'wo', label = 'Point Estimate')

plt.legend()
plt.show()

Kodu Düzenle ve Çalıştır

Bu egzersiz, kursun bir parçasıdır

Python'da Veri Görselleştirmelerini İyileştirme

IntermediárioNível de habilidade

4.7+

Kursa Ücretsiz Başla

Tüm verilerini gösterirken izleyicinin önemli bir noktayı kaçırmamasını nasıl sağlarsın? Burada, izleyicini verinin içinde renk tabanlı vurgular ve metinle nasıl yönlendireceğini tartışıyoruz. Ayrıca, Amerika Birleşik Devletleri genelindeki yaygın kirletici değerlerine dair bir veri kümesini tanıtıyoruz.

Exercise 1: Veriyi vurgulama Exercise 2: Vurguyu elle (hardcode) yapmak Exercise 3: Programatik olarak vurgulama oluşturma Exercise 4: Grupları karşılaştırma Exercise 5: İki KDE ile karşılaştırma Exercise 6: KDE'lerini geliştirme Exercise 7: Arı sürüsü grafikleri Exercise 8: Açıklama Notları Exercise 9: Temel bir metin açıklaması Exercise 10: Ok anotasyonları Exercise 11: Açıklamalar ve rengi birleştirme

Renk, veri görselleştirmede değerleri kodlamak için güçlü bir araçtır. Ancak bu güçle birlikte risk de gelir. Bu bölümde, görselleştirmenin gösterdiği veri türüne bağlı olarak uygun bir renk paletinin nasıl seçileceğinden bahsediyoruz.

Exercise 1: Görselleştirmelerde renk Exercise 2: Gereksiz rengi kaldırmak Exercise 3: Seaborn'ın çubuk grafiklerini düzeltmek Exercise 4: Sürekli renk paletleri Exercise 5: Özel bir sürekli palet oluşturma Exercise 6: Ayrışan paletli bir ısı haritasını özelleştirme Exercise 7: Paletini bağlama göre ayarlama Exercise 8: Kategorik paletler Exercise 9: Özel bir kategorik palet kullanma Exercise 10: Çok fazla kategoriyle başa çıkmak Exercise 11: Sıralı kategorileri renklendirme Exercise 12: Renge kodlamak için doğru değişkeni seçmek

Belirsizlik veri biliminin her yerinde vardır, ancak çoğu zaman dahil edilmesi gerekirken görselleştirmelerde yer almaz. Burada güven aralığının ne olduğunu gözden geçiriyor ve hem tekil tahminler hem de sürekli fonksiyonlar için nasıl görselleştirileceğini ele alıyoruz. Ayrıca belirsizliği değerlendirmek için bootstrap yeniden örnekleme tekniğini ve bunu doğru şekilde nasıl görselleştireceğimizi tartışıyoruz.

Exercise 1: Noktasal tahmin aralıkları Exercise 2: Temel güven aralıkları Exercise 3: Güven aralıklarını açıklama ekleme Exercise 4: Güven bantları Exercise 5: Güven bandı oluşturma Exercise 6: Bir sürü bandı ayırmak Exercise 7: Örtüşmeler için bantları düzenleme Exercise 8: %95’in Ötesinde Exercise 9: %90, %95 ve %99 aralıkları

Geçerli egzersiz

Exercise 10: %90 ve %95 bantları Exercise 11: Renklendirme yerine bant kalınlığını kullanma Exercise 12: Bootstrap'ı görselleştirme Exercise 13: Bootstrap histogramı Exercise 14: Bootstrap ile regresyonlar Exercise 15: Arı sürüsü grafikleriyle bolca bootstrap

Görselleştirme çoğu zaman genel en iyi uygulamalar şeklinde, ayrı bir konu olarak öğretilir. Gerçekte ise farklı senaryolar için kuralları esnetmen gerekir. Dağınık keşif görselleştirmelerinden, son ürününün yazı tipi boyutlarını cilalamaya kadar; bu bölümde veri bilimi iş akışının her adımında görselleştirmelerini nasıl optimize edeceğine dalıyoruz.

Exercise 1: İlk keşifler Exercise 2: Farmer’s market verilerine bakış Exercise 3: Sayısal sütunların saçılım matrisi Exercise 4: Temel dönüşümlerle derine inmek Exercise 5: Kalıpları keşfetmek Exercise 6: Enlem, açık olunan aylarla ilişkili mi?Exercise 7: Hangi eyalet pazar dostu?Exercise 8: Eyalete göre satılan ürünlerin popülerliği Exercise 9: Görselleştirmelerini verimli hale getirmek Exercise 10: Eğilimleri bulmak için yığma Exercise 11: Bir grafiği legend olarak kullanma Exercise 12: Grafiklerini ince ayar yapma Exercise 13: Arka planı sadeleştirme Exercise 14: Bir grafiği yeniden düzenleme Exercise 15: Okunabilirliği artırma Exercise 16: Tebrikler!