Veriyi parça parça yüklemek için bir yineleyici yazma (4)

Önceki egzersizlerde yalnızca ilk DataFrame parçasındaki veriyi işlemiştin. Bu kez, veri kümesindeki tüm DataFrame parçaları üzerindeki sonuçları birleştireceksin. Bu, aslında artık veri kümesinin tamamını işleyeceğin anlamına geliyor. Bu harika, çünkü büyük bir veri kümesini küçük parçalar üzerinde çalışarak baştan sona işleyebileceksin!

Geçerli dizininde bulunan 'ind_pop_data.csv' dosyasındaki veriyi kullanacaksın. pandas ve matplotlib.pyplot paketleri sırasıyla pd ve plt olarak içe aktarılmış durumda.

Bu egzersiz, kursun bir parçasıdır

Python Araç Kutusu

Kursa Göz Atın

Egzersiz talimatları

pd.DataFrame() kullanarak boş bir data DataFrame'i başlat.
for döngüsünde, veri kümesindeki tüm DataFrame parçalarını işleyebilmek için urb_pop_reader üzerinde yinele.
pd.concat()'e DataFrame'lerden oluşan bir liste vererek data ile df_pop_ceb'i birleştir.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Initialize reader object: urb_pop_reader
urb_pop_reader = pd.read_csv('ind_pop_data.csv', chunksize=1000)

# Initialize empty DataFrame: data
data = ____

# Iterate over each DataFrame chunk
for df_urb_pop in ____:

    # Check out specific country: df_pop_ceb
    df_pop_ceb = df_urb_pop[df_urb_pop['CountryCode'] == 'CEB']

    # Zip DataFrame columns of interest: pops
    pops = zip(df_pop_ceb['Total Population'],
                df_pop_ceb['Urban population (% of total)'])

    # Turn zip object into list: pops_list
    pops_list = list(pops)

    # Use list comprehension to create new DataFrame column 'Total Urban Population'
    df_pop_ceb['Total Urban Population'] = [int(tup[0] * tup[1] * 0.01) for tup in pops_list]
    
    # Concatenate DataFrame chunk to the end of data: data
    data = ____

# Plot urban population data
data.plot(kind='scatter', x='Year', y='Total Urban Population')
plt.show()

Kodu Düzenle ve Çalıştır