1. Nauka
  2. /
  3. Kursy
  4. /
  5. Czyszczenie danych w Pythonie

Connected

ćwiczenie

Usuwanie tytułów i wyodrębnianie imion

Podczas zbierania metadanych respondentów ankiety w DataFrame airlines pełne imiona i nazwiska respondentów zostały zapisane w kolumnie full_name. Po dokładniejszej analizie okazało się jednak, że wiele z tych nazw poprzedzonych jest tytułami grzecznościowymi, takimi jak "Dr.", "Mr.", "Ms." czy "Miss".

Twoim ostatecznym celem jest utworzenie dwóch nowych kolumn – first_name oraz last_name – zawierających odpowiednio imiona i nazwiska respondentów. Zanim to jednak zrobisz, musisz usunąć tytuły grzecznościowe.

DataFrame airlines jest dostępny w twoim środowisku wraz z biblioteką pandas jako pd.

Instrukcje

100 XP
  • Usuń "Dr.", "Mr.", "Miss" oraz "Ms." z kolumny full_name, zastępując je kolejno pustym ciągiem znaków "".
  • Uruchom instrukcję assert z użyciem .str.contains(), która sprawdza, czy kolumna full_name nadal zawiera którykolwiek z tytułów grzecznościowych.