Ünvanları kaldırma ve adları alma
Anket katılımcı meta verilerini airlines DataFrame'inde toplarken, katılımcıların tam adı full_name sütununa kaydedildi. Ancak daha yakından bakınca, pek çok farklı adın "Dr.", "Mr.", "Ms." ve "Miss" gibi ünvanlarla başladığını fark ettin.
Nihai amacın, sırasıyla katılımcıların ilk ve son adlarını içeren first_name ve last_name adlı iki yeni sütun oluşturmak. Ancak bunu yapmadan önce, ünvanları kaldırman gerekiyor.
airlines DataFrame'i ortamında mevcut, ayrıca pandas da pd takma adıyla yüklü.
Bu egzersiz
Python ile Veri Temizleme
kursunun bir parçasıdırEgzersiz talimatları
full_nameiçinden sırasıyla"Dr.","Mr.","Miss"ve"Ms."ifadelerini, bunları boş bir dize""ile değiştirerek kaldır.full_nameiçinde hâlâ herhangi bir ünvan kalıp kalmadığını test eden.str.contains()kullananassertifadesini çalıştır.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Replace "Dr." with empty string ""
airlines['full_name'] = airlines['full_name'].____.____("____","")
# Replace "Mr." with empty string ""
airlines['full_name'] = ____
# Replace "Miss" with empty string ""
____
# Replace "Ms." with empty string ""
____
# Assert that full_name has no honorifics
assert airlines['full_name'].str.contains('Ms.|Mr.|Miss|Dr.').any() == False