1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶデータクリーニング

Connected

演習

敬称を外して氏名を取り出す

airlines DataFrame で調査回答者のメタデータを収集する際、回答者の氏名が full_name 列にフルネームとして保存されました。ところが詳しく確認すると、多くの名前の前に "Dr."、"Mr."、"Ms."、"Miss" といった敬称が付いていることが分かりました。

最終的な目標は、回答者の名と姓をそれぞれ含む first_name と last_name という 2 つの新しい列を作成することです。その前段階として、敬称を取り除く必要があります。

airlines DataFrame は環境内にあり、pandas は pd として読み込まれています。

指示

100 XP
  • full_name から "Dr."、"Mr."、"Miss"、"Ms." を、この順番で空文字列 "" に置き換えて削除します。
  • .str.contains() を使った assert 文を実行し、full_name に敬称が残っていないかをテストします。