Zaman serilerini dilimleme
Dilimleme, tarih aralığı içindeki verileri filtrelemek yaygın bir işlem olduğundan zaman serileri için özellikle kullanışlıdır. date sütununu dizine ekleyin, ardından .loc[] kullanarak alt küme oluşturun. Unutulmaması gereken önemli nokta, tarihleri ISO 8601 formatında tutmaktır, yani yıl-ay-gün için "yyyy-mm-dd", yıl-ay için "yyyy-mm" ve yıl için "yyyy".
- Bölümden hatırlayacağınız gibi, mantıksal işleçler kullanarak birden fazla Boole koşulunu birleştirebilirsiniz, örneğin
&. Bunu tek bir kod satırında yapmak için, her koşulun etrafına ayraçlar (()) eklemeniz gerekir.
pandas pd olarak yüklenmiştir ve temperatures dizinsiz olarak kullanılabilir durumdadır.
Bu egzersiz
pandas ile Veri İşleme
kursunun bir parçasıdırEgzersiz talimatları
.isin()veya.loc[]yerine Boole koşulları ve tam tarih"yyyy-mm-dd"kullanarak,datesütununun 2010 ve 2011 yıllarında olduğu satırları içerentemperaturesalt kümesini oluşturun ve sonuçları yazdırın.temperaturesdizininidatesütununa ayarlayın ve sıralayın..loc[]fonksiyonunu kullanarak, 2010 ve 2011’deki satırlar içintemperatures_indalt kümesini oluşturun..loc[]komutunu kullanarak August 2010 ile February 2011 arasındaki satırlar içintemperatures_indalt kümesini oluşturun.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Use Boolean conditions to subset temperatures for rows in 2010 and 2011
temperatures_bool = ____[(____ >= ____) & (____ <= ____)]
print(temperatures_bool)
# Set date as the index and sort the index
temperatures_ind = temperatures.____.____
# Use .loc[] to subset temperatures_ind for rows in 2010 and 2011
print(____)
# Use .loc[] to subset temperatures_ind for rows from Aug 2010 to Feb 2011
print(____)