BaşlayınÜcretsiz Başlayın

Veriyi parça parça işleme (1)

Bazen veri kaynakları o kadar büyük olur ki tüm veri kümesini bellekte tutmak aşırı kaynak tüketir. Bu egzersizde, bir dosyanın ilk 1000 satırını satır satır işleyerek, veri kümesindeki bir sütunda her ülkenin kaç kez göründüğünü sayan bir sözlük oluşturacaksın.

'world_dev_ind.csv' adlı csv dosyası, kullanımın için bulunduğun dizinde yer alıyor. Başlamak için, bir bağlam yöneticisi (context manager) kullanarak bu dosyaya bir bağlantı açman gerekiyor. Örneğin, with open('datacamp.csv') as datacamp komutu, 'datacamp.csv' dosyasını bağlam yöneticisinde datacamp olarak bağlar. Burada with ifadesi bağlam yöneticisidir ve amacı, bir dosyaya bağlantı açarken kaynakların verimli bir şekilde yönetilmesini sağlamaktır.

Bağlam yöneticileri hakkında daha fazla bilgi edinmek istersen, Python'da Veri İçe Aktarma ile ilgili DataCamp kursuna göz atabilirsin.

Bu egzersiz

Python Araç Kutusu

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • Bağlam yöneticisinde open() kullanarak 'world_dev_ind.csv' adlı csv dosyasını file olarak bağla.
  • Yalnızca dosyanın ilk 1000 satırını işlemek için döngü gövdesini çalıştıracak şekilde for döngüsünü 1000 kez yineleyecek biçimde tamamla.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Open a connection to the file
with ____ as ____:

    # Skip the column names
    file.readline()

    # Initialize an empty dictionary: counts_dict
    counts_dict = {}

    # Process only the first 1000 rows
    for j in ____:

        # Split the current line into a list: line
        line = file.readline().split(',')

        # Get the value for the first column: first_col
        first_col = line[0]

        # If the column value is in the dict, increment its value
        if first_col in counts_dict.keys():
            counts_dict[first_col] += 1

        # Else, add to the dict and set value to 1
        else:
            counts_dict[first_col] = 1

# Print the resulting dictionary
print(counts_dict)
Kodu Düzenle ve Çalıştır