BaşlayınÜcretsiz Başlayın

%90, %95 ve %99 aralıkları

Alaska, Fairbanks’te bir açık hava macera şirketinde veri bilimcisin. Son zamanlarda müşteriler SO2 kirliliğiyle ilgili sorunlar yaşıyor ve bu da maliyetli iptallere yol açıyor. Şirketin CO, NO2 ve O3 için sensörleri var, ancak SO2 seviyeleri için yok.

Sensörleri olan kirleticilerin değerlerine göre SO2 değerlerini tahmin eden bir model kurdun (pollution_model olarak yüklenen bir statsmodels nesnesi). Modelinin SO2 tahmininde hangi kirleticinin değerinin en büyük etkiye sahip olduğunu araştırmak istiyorsun. Bu, açık hava turları planlarken hangi kirleticinin değerlerine en çok dikkat etmen gerektiğini bilmene yardımcı olacak. Raporundaki bilgi miktarını en üst düzeye çıkarmak için model tahminleri için birden fazla belirsizlik düzeyi göster.

Bu egzersiz

Python'da Veri Görselleştirmelerini İyileştirme

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • alpha listesindeki değerlere göre uygun aralık genişliği yüzdelerini (%.90, %.95 ve %.99’dan) doldur.
  • For döngüsünde, aralığı atanan color ile renklendir.
  • Göstergeyi etiketlemek için döngünün width yüzde değerini plt.hlines() fonksiyonuna geçir.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Add interval percent widths
alphas = [     0.01,  0.05,   0.1] 
widths = [ '__% CI', '__%', '__%']
colors = ['#fee08b','#fc8d59','#d53e4f']

for alpha, color, width in zip(alphas, colors, widths):
    # Grab confidence interval
    conf_ints = pollution_model.conf_int(alpha)
    
    # Pass current interval color and legend label to plot
    plt.hlines(y = conf_ints.index, xmin = conf_ints[0], xmax = conf_ints[1],
               colors = ____, ____ = width, linewidth = 10) 

# Draw point estimates
plt.plot(pollution_model.params, pollution_model.params.index, 'wo', label = 'Point Estimate')

plt.legend()
plt.show() 
Kodu Düzenle ve Çalıştır