Veriyi parça parça yüklemek için bir yineleyici yazma (2)

Önceki egzersizde, büyük bir veri kümesinden DataFrame parçalarını okumak için read_csv() kullandın. Bu egzersizde, dosyayı daha büyük bir DataFrame parça boyutuyla okuyacak ve ardından ilk parçadaki veriyi işleyeceksin.

Veriyi işlemek için, yalnızca belirli bir ülkeye ait satırlardan oluşan başka bir DataFrame oluşturacaksın. Sonrasında, yeni DataFrame'den 'Total Population' ve 'Urban population (% of total)' sütunlarını birlikte zip'leyeceksin. Son olarak, zip nesnesinden, bahsedilen iki sütundan birer değer içeren demetlerden (tuple) oluşan bir liste oluşturacaksın.

Mevcut dizininde bulunan 'ind_pop_data.csv' dosyasındaki veriyi kullanacaksın. pandas zaten pd olarak içe aktarılmış durumda.

Bu egzersiz, kursun bir parçasıdır

Python Araç Kutusu

Kursa Göz Atın

Egzersiz talimatları

pd.read_csv() kullanarak 'ind_pop_data.csv' dosyasını 1000 boyutunda parçalar halinde oku. Sonucu urb_pop_reader değişkenine ata.
Yineleyici urb_pop_reader içinden ilk DataFrame parçasını al ve df_urb_pop değişkenine ata.
'CountryCode' değeri 'CEB' olan yalnızca df_urb_pop satırlarını seç. Bunu yapmak için, df_urb_pop[____] içindeki köşeli parantezlerde df_urb_pop['CountryCode'] değerinin 'CEB' ile eşit olup olmadığını karşılaştır.
zip() kullanarak, df_pop_ceb DataFrame'inin 'Total Population' ve 'Urban population (% of total)' sütunlarını birlikte zip'le. Ortaya çıkan zip nesnesini pops değişkenine ata.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Initialize reader object: urb_pop_reader
urb_pop_reader = pd.read_csv(____, ____)

# Get the first DataFrame chunk: df_urb_pop
df_urb_pop = next(____)

# Check out the head of the DataFrame
print(df_urb_pop.head())

# Check out specific country: df_pop_ceb
df_pop_ceb = df_urb_pop[____]

# Zip DataFrame columns of interest: pops
pops = zip(____, ____)

# Turn zip object into list: pops_list
pops_list = list(pops)

# Print pops_list
print(pops_list)

Kodu Düzenle ve Çalıştır