1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Làm sạch dữ liệu với Python

Connected

Bài tập

Xóa danh xưng và tách tên

Khi thu thập metadata người trả lời khảo sát trong DataFrame airlines, họ tên đầy đủ của người trả lời được lưu trong cột full_name. Tuy nhiên, khi kiểm tra kỹ hơn, bạn thấy nhiều tên được thêm tiền tố là danh xưng như "Dr.", "Mr.", "Ms." và "Miss".

Mục tiêu cuối cùng của bạn là tạo hai cột mới tên là first_name và last_name, lần lượt chứa tên và họ của người trả lời. Tuy nhiên, trước khi làm điều đó, bạn cần xóa các danh xưng.

DataFrame airlines đã có sẵn trong môi trường của bạn, cùng với pandas được nhập là pd.

Hướng dẫn

100 XP
  • Xóa "Dr.", "Mr.", "Miss" và "Ms." khỏi full_name bằng cách thay thế chúng bằng chuỗi rỗng "" theo đúng thứ tự đó.
  • Chạy câu lệnh assert sử dụng .str.contains() để kiểm tra xem full_name còn chứa bất kỳ danh xưng nào không.