Özel NA değerleri ayarla
Veri keşfi ve temizliğinin bir kısmı, eksik ya da NA değerleri kontrol edip bunlarla nasıl başa çıkacağına karar vermekten oluşur. Eksik değerler kendi veri tipi olarak ele alındığında bu daha kolaydır ve bu tür NA değerlerini hedefleyen özel pandas işlevleri vardır. pandas bazı değerleri otomatik olarak eksik sayar, ancak na_values argümanıyla ek NA göstergeleri geçebiliriz. Burada, Vermont vergi verilerinde geçersiz ZIP kodlarının NA olarak kodlandığından emin olmak için bunu yapacaksın.
pandas, pd takma adıyla içe aktarılmıştır.
Bu egzersiz
pandas ile Kolaylaştırılmış Veri Alımı
kursunun bir parçasıdırEgzersiz talimatları
zipcodesütunundaki0ların NA değeri olarak kabul edilmesi gerektiğini belirten bir sözlüknull_valuesoluştur.- Geçersiz ZIP kodlarının eksik olarak ele alındığından emin olmak için
na_valuesargümanını ve bu sözlüğü kullanarakvt_tax_data_2016.csvdosyasını yükle.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Create dict specifying that 0s in zipcode are NA values
null_values = {____}
# Load csv using na_values keyword argument
data = pd.read_csv("vt_tax_data_2016.csv",
____)
# View rows with NA ZIP codes
print(data[data.zipcode.isna()])