BaşlayınÜcretsiz Başlayın

Başıboş karakterlerle başa çıkma (II)

Son egzersizde, df.head() çağrısından yola çıkarak hangi karakterlerin sorun çıkardığını hızlıca anlayabilmiştin. Çoğu durumda bu kadar bariz olmayacak. Bir sütunun derinliklerinde, sütunu sayısal türe dönüştürmeni engelleyen ve bu yüzden modeli ya da sonraki özellik mühendisliğini aksatan değerler sıkça bulunur.

Bu değerleri bulmanın bir yolu, pd.to_numeric() kullanarak sütunu istediğin veri türüne zorlamak, sorun çıkaran değerleri NaN'e dönüştürmek ve ardından yalnızca NaN içeren satırlara göre DataFrame'i filtrelemektir.

RawSalary sütununu float'a çevirmeyi dene; başarısız olacak çünkü içinde fazladan bir karakter var. Bu karakteri bul ve kaldır ki sütun float olarak dönüştürülebilsin.

Bu egzersiz

Python ile Machine Learning için Özellik Mühendisliği

kursunun bir parçasıdır
Kursu Görüntüle

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Attempt to convert the column to numeric values
numeric_vals = ____(so_survey_df['RawSalary'], errors='coerce')

# Find the indexes of missing values
idx = ____

# Print the relevant rows
print(so_survey_df['RawSalary']____)
Kodu Düzenle ve Çalıştır