Veriyi parça parça yüklemek için bir yineleyici yazma (2)
Önceki egzersizde, büyük bir veri kümesinden DataFrame parçalarını okumak için read_csv() kullandın. Bu egzersizde, dosyayı daha büyük bir DataFrame parça boyutuyla okuyacak ve ardından ilk parçadaki veriyi işleyeceksin.
Veriyi işlemek için, yalnızca belirli bir ülkeye ait satırlardan oluşan başka bir DataFrame oluşturacaksın. Sonrasında, yeni DataFrame'den 'Total Population' ve 'Urban population (% of total)' sütunlarını birlikte zip'leyeceksin. Son olarak, zip nesnesinden, bahsedilen iki sütundan birer değer içeren demetlerden (tuple) oluşan bir liste oluşturacaksın.
Mevcut dizininde bulunan 'ind_pop_data.csv' dosyasındaki veriyi kullanacaksın. pandas zaten pd olarak içe aktarılmış durumda.
Bu egzersiz
Python Araç Kutusu
kursunun bir parçasıdırEgzersiz talimatları
pd.read_csv()kullanarak'ind_pop_data.csv'dosyasını1000boyutunda parçalar halinde oku. Sonucuurb_pop_readerdeğişkenine ata.- Yineleyici
urb_pop_readeriçinden ilk DataFrame parçasını al vedf_urb_popdeğişkenine ata. 'CountryCode'değeri'CEB'olan yalnızcadf_urb_popsatırlarını seç. Bunu yapmak için,df_urb_pop[____]içindeki köşeli parantezlerdedf_urb_pop['CountryCode']değerinin'CEB'ile eşit olup olmadığını karşılaştır.zip()kullanarak,df_pop_cebDataFrame'inin'Total Population've'Urban population (% of total)'sütunlarını birlikte zip'le. Ortaya çıkan zip nesnesinipopsdeğişkenine ata.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Initialize reader object: urb_pop_reader
urb_pop_reader = pd.read_csv(____, ____)
# Get the first DataFrame chunk: df_urb_pop
df_urb_pop = next(____)
# Check out the head of the DataFrame
print(df_urb_pop.head())
# Check out specific country: df_pop_ceb
df_pop_ceb = df_urb_pop[____]
# Zip DataFrame columns of interest: pops
pops = zip(____, ____)
# Turn zip object into list: pops_list
pops_list = list(pops)
# Print pops_list
print(pops_list)