Güven aralıklarını açıklama ekleme
Hava kirliliği verileriyle yaptığın veri bilimi çalışmaları efsane oldu ve şimdi Ohio, Cincinnati ile Indiana, Indianapolis'ten iş teklifleri değerlendiriyorsun. İki şehirdeki SO2 seviyelerinin anlamlı biçimde farklı olup olmadığını ve özellikle de hangi şehrin seviyelerinin daha düşük olduğunu görmek istiyorsun. Bunu test etmek için, şehirlerin SO2 değerlerindeki farklara (Indianapolis - Cincinnati) birden fazla yıl boyunca bakmaya karar verdin (diffs_by_year olarak verildi).
Sadece şehirler arasında anlamlı fark için bir p-değeri göstermek yerine, farkların %95 güven aralıklarına (lower ve upper sütunları) bakmaya karar verdin. Bu sayede farkların büyüklüğünü ve yıllar içindeki eğilimleri birlikte görebilirsin.
Bu egzersiz, kursun bir parçasıdır
Python'da Veri Görselleştirmelerini İyileştirme
Egzersiz talimatları
- Güven aralıkların için başlangıç ve bitiş sınırlarını (
lowerveuppersütunları)plt.hlines()'a ver. - Aralık kalınlığını
5olarak ayarla. plt.axvline()ile0farkını temsil eden dikey bir çizgi çiz.- Yokluk (null) çizgisini öne çıkarmak için rengini
'orangered'yap.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Set start and ends according to intervals
# Make intervals thicker
plt.hlines(y = 'year', xmin = '____', xmax = '____',
linewidth = ____, color = 'steelblue', alpha = 0.7,
data = diffs_by_year)
# Point estimates
plt.plot('mean', 'year', 'k|', data = diffs_by_year)
# Add a 'null' reference line at 0 and color orangered
plt.axvline(x = ____, color = '____', linestyle = '--')
# Set descriptive axis labels and title
plt.xlabel('95% CI')
plt.title('Avg SO2 differences between Cincinnati and Indianapolis')
plt.show()