Ünvanları kaldırma ve adları alma
Anket katılımcı meta verilerini airlines DataFrame'inde toplarken, katılımcıların tam adı full_name sütununa kaydedildi. Ancak daha yakından bakınca, pek çok farklı adın "Dr.", "Mr.", "Ms." ve "Miss" gibi ünvanlarla başladığını fark ettin.
Nihai amacın, sırasıyla katılımcıların ilk ve son adlarını içeren first_name ve last_name adlı iki yeni sütun oluşturmak. Ancak bunu yapmadan önce, ünvanları kaldırman gerekiyor.
airlines DataFrame'i ortamında mevcut, ayrıca pandas da pd takma adıyla yüklü.
Bu egzersiz, kursun bir parçasıdır
Python ile Veri Temizleme
Egzersiz talimatları
full_nameiçinden sırasıyla"Dr.","Mr.","Miss"ve"Ms."ifadelerini, bunları boş bir dize""ile değiştirerek kaldır.full_nameiçinde hâlâ herhangi bir ünvan kalıp kalmadığını test eden.str.contains()kullananassertifadesini çalıştır.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Replace "Dr." with empty string ""
airlines['full_name'] = airlines['full_name'].____.____("____","")
# Replace "Mr." with empty string ""
airlines['full_name'] = ____
# Replace "Miss" with empty string ""
____
# Replace "Ms." with empty string ""
____
# Assert that full_name has no honorifics
assert airlines['full_name'].str.contains('Ms.|Mr.|Miss|Dr.').any() == False