Satırların düşürülmesi
Analizinde belirli bir sütunun kritik olacağını biliyor ve bu sütunda yalnızca küçük bir kısım satırın değeri eksikse, bu satırları veri kümesinden çıkarmak genellikle mantıklıdır.
Bu derste, driver_gender sütunu analizlerinin birçoğu için kritik olacak. driver_gender değeri eksik olan satırlar yalnızca küçük bir kısmı oluşturduğundan, bu satırları veri kümesinden kaldıracağız.
Bu egzersiz
pandas ile Polis Faaliyetlerini Analiz Etme
kursunun bir parçasıdırEgzersiz talimatları
- Her sütundaki eksik değerlerin sayısını say.
.dropna()metodununsubsetparametresine sütun adını vererekdriver_genderdeğeri eksik olan tüm satırları kaldır.- Kalan satırlarda
driver_gendereksik olmadığını doğrulamak için her sütundaki eksik değerleri tekrar say. - Kaç satır ve sütun kaldığını görmek için DataFrame'in
.shapeniteliğini incele.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Count the number of missing values in each column
print(ri.isnull().____)
# Drop all rows that are missing 'driver_gender'
ri.____(subset=[____], inplace=True)
# Count the number of missing values in each column (again)
print(ri.____.____)
# Examine the shape of the DataFrame
print(____)