BaşlayınÜcretsiz Başlayın

Veriyi parça parça yüklemek için bir yineleyici yazma (4)

Önceki egzersizlerde yalnızca ilk DataFrame parçasındaki veriyi işlemiştin. Bu kez, veri kümesindeki tüm DataFrame parçaları üzerindeki sonuçları birleştireceksin. Bu, aslında artık veri kümesinin tamamını işleyeceğin anlamına geliyor. Bu harika, çünkü büyük bir veri kümesini küçük parçalar üzerinde çalışarak baştan sona işleyebileceksin!

Geçerli dizininde bulunan 'ind_pop_data.csv' dosyasındaki veriyi kullanacaksın. pandas ve matplotlib.pyplot paketleri sırasıyla pd ve plt olarak içe aktarılmış durumda.

Bu egzersiz

Python Araç Kutusu

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • pd.DataFrame() kullanarak boş bir data DataFrame'i başlat.
  • for döngüsünde, veri kümesindeki tüm DataFrame parçalarını işleyebilmek için urb_pop_reader üzerinde yinele.
  • pd.concat()'e DataFrame'lerden oluşan bir liste vererek data ile df_pop_ceb'i birleştir.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Initialize reader object: urb_pop_reader
urb_pop_reader = pd.read_csv('ind_pop_data.csv', chunksize=1000)

# Initialize empty DataFrame: data
data = ____

# Iterate over each DataFrame chunk
for df_urb_pop in ____:

    # Check out specific country: df_pop_ceb
    df_pop_ceb = df_urb_pop[df_urb_pop['CountryCode'] == 'CEB']

    # Zip DataFrame columns of interest: pops
    pops = zip(df_pop_ceb['Total Population'],
                df_pop_ceb['Urban population (% of total)'])

    # Turn zip object into list: pops_list
    pops_list = list(pops)

    # Use list comprehension to create new DataFrame column 'Total Urban Population'
    df_pop_ceb['Total Urban Population'] = [int(tup[0] * tup[1] * 0.01) for tup in pops_list]
    
    # Concatenate DataFrame chunk to the end of data: data
    data = ____

# Plot urban population data
data.plot(kind='scatter', x='Year', y='Total Urban Population')
plt.show()
Kodu Düzenle ve Çalıştır