%90, %95 ve %99 aralıkları
Alaska, Fairbanks’te bir açık hava macera şirketinde veri bilimcisin. Son zamanlarda müşteriler SO2 kirliliğiyle ilgili sorunlar yaşıyor ve bu da maliyetli iptallere yol açıyor. Şirketin CO, NO2 ve O3 için sensörleri var, ancak SO2 seviyeleri için yok.
Sensörleri olan kirleticilerin değerlerine göre SO2 değerlerini tahmin eden bir model kurdun (pollution_model olarak yüklenen bir statsmodels nesnesi). Modelinin SO2 tahmininde hangi kirleticinin değerinin en büyük etkiye sahip olduğunu araştırmak istiyorsun. Bu, açık hava turları planlarken hangi kirleticinin değerlerine en çok dikkat etmen gerektiğini bilmene yardımcı olacak. Raporundaki bilgi miktarını en üst düzeye çıkarmak için model tahminleri için birden fazla belirsizlik düzeyi göster.
Bu egzersiz
Python'da Veri Görselleştirmelerini İyileştirme
kursunun bir parçasıdırEgzersiz talimatları
alphalistesindeki değerlere göre uygun aralık genişliği yüzdelerini (%.90, %.95 ve %.99’dan) doldur.- For döngüsünde, aralığı atanan
colorile renklendir. - Göstergeyi etiketlemek için döngünün
widthyüzde değeriniplt.hlines()fonksiyonuna geçir.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Add interval percent widths
alphas = [ 0.01, 0.05, 0.1]
widths = [ '__% CI', '__%', '__%']
colors = ['#fee08b','#fc8d59','#d53e4f']
for alpha, color, width in zip(alphas, colors, widths):
# Grab confidence interval
conf_ints = pollution_model.conf_int(alpha)
# Pass current interval color and legend label to plot
plt.hlines(y = conf_ints.index, xmin = conf_ints[0], xmax = conf_ints[1],
colors = ____, ____ = width, linewidth = 10)
# Draw point estimates
plt.plot(pollution_model.params, pollution_model.params.index, 'wo', label = 'Point Estimate')
plt.legend()
plt.show()