1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Čištění dat v Pythonu

Connected

cvičení

Odstranění titulů a práce se jmény

Při shromažďování metadat o respondentech průzkumu do DataFrame airlines bylo celé jméno každého respondenta uloženo do sloupce full_name. Po bližším prozkoumání jsi ale zjistil/a, že mnohá jména jsou uvozena oslovením, jako například "Dr.", "Mr.", "Ms." nebo "Miss".

Tvým cílem je vytvořit dva nové sloupce first_name a last_name, které budou obsahovat křestní jméno a příjmení respondentů. Nejdříve ale musíš tato oslovení odstranit.

DataFrame airlines je dostupný v tvém prostředí, spolu s knihovnou pandas jako pd.

Pokyny

100 XP
  • Odstraň z full_name hodnoty "Dr.", "Mr.", "Miss" a "Ms." tak, že je v daném pořadí nahradíš prázdným řetězcem "".
  • Spusť příkaz assert s použitím .str.contains(), který otestuje, zda full_name stále obsahuje některé z těchto oslovení.