Düz dosyaları DataFrame olarak içe aktarmak için pandas kullanma (2)
Son egzersizde, düz dosyaları bir pandas DataFrame'ine içe aktarabilmiştin. Ek olarak, .to_numpy() metodunu kullanarak ilgili numpy dizisini elde etmek de oldukça kolay. Şimdi, digits.csv olarak sunulan MNIST veri kümesini kullanarak bunu yapma şansın olacak.
Bu egzersizde işine yarayacak birkaç pd.read_csv() argümanı var:
nrows, dosyadan kaç satır okunacağını belirtmeni sağlar. Örneğin,nrows=10yalnızca ilk 10 satırı içe aktarır.header, sütun etiketleri olarak kullanılacak satır numaralarını kabul eder ve verinin başlangıcını belirtir. Dosyada bir başlık satırı yoksaheader=Noneayarlayabilir vepandassütun etiketlerini otomatik olarak 0'dan başlayarak tamsayılar olarak atar (ör. 0, 1, 2, …).
Bu egzersiz
Python'da Veri Aktarmaya Giriş
kursunun bir parçasıdırEgzersiz talimatları
- Dosyanın ilk 5 satırını
pd.read_csv()fonksiyonunu kullanarak bir DataFrame'e aktar ve sonucudatadeğişkenine ata.nrowsveheaderargümanlarını kullanman gerekecek. Bu dosyada başlık satırı olmadığını unutma. dataiçindeki DataFrame'den birnumpydizisi oluştur vedata_arraydeğişkenine ata.data_arrayveri tipini yazdırmak içinprint(type(data_array))çalıştır.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Assign the filename: file
file = 'digits.csv'
# Read the first 5 rows of the file into a DataFrame: data
data = ____(____, ____, ____)
# Build a numpy array from the DataFrame: data_array
data_array = ____
# Print the datatype of data_array to the shell
print(type(data_array))