Veriyi parça parça yüklemek için bir yineleyici yazma (4)
Önceki egzersizlerde yalnızca ilk DataFrame parçasındaki veriyi işlemiştin. Bu kez, veri kümesindeki tüm DataFrame parçaları üzerindeki sonuçları birleştireceksin. Bu, aslında artık veri kümesinin tamamını işleyeceğin anlamına geliyor. Bu harika, çünkü büyük bir veri kümesini küçük parçalar üzerinde çalışarak baştan sona işleyebileceksin!
Geçerli dizininde bulunan 'ind_pop_data.csv' dosyasındaki veriyi kullanacaksın. pandas ve matplotlib.pyplot paketleri sırasıyla pd ve plt olarak içe aktarılmış durumda.
Bu egzersiz
Python Araç Kutusu
kursunun bir parçasıdırEgzersiz talimatları
pd.DataFrame()kullanarak boş birdataDataFrame'i başlat.fordöngüsünde, veri kümesindeki tüm DataFrame parçalarını işleyebilmek içinurb_pop_readerüzerinde yinele.pd.concat()'e DataFrame'lerden oluşan bir liste vererekdatailedf_pop_ceb'i birleştir.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Initialize reader object: urb_pop_reader
urb_pop_reader = pd.read_csv('ind_pop_data.csv', chunksize=1000)
# Initialize empty DataFrame: data
data = ____
# Iterate over each DataFrame chunk
for df_urb_pop in ____:
# Check out specific country: df_pop_ceb
df_pop_ceb = df_urb_pop[df_urb_pop['CountryCode'] == 'CEB']
# Zip DataFrame columns of interest: pops
pops = zip(df_pop_ceb['Total Population'],
df_pop_ceb['Urban population (% of total)'])
# Turn zip object into list: pops_list
pops_list = list(pops)
# Use list comprehension to create new DataFrame column 'Total Urban Population'
df_pop_ceb['Total Urban Population'] = [int(tup[0] * tup[1] * 0.01) for tup in pops_list]
# Concatenate DataFrame chunk to the end of data: data
data = ____
# Plot urban population data
data.plot(kind='scatter', x='Year', y='Total Urban Population')
plt.show()