1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Tiền xử lý cho Machine Learning bằng Python

Connected

Bài tập

Trích xuất số từ chuỗi

Trường length_of_time trong bộ dữ liệu UFO là một trường dạng văn bản có chứa số phút bên trong chuỗi. Ở đây, bạn sẽ trích xuất con số đó từ trường văn bản bằng biểu thức chính quy (regular expressions).

Hướng dẫn

100 XP
  • Tìm kiếm số trong time_string bằng một mẫu RegEx phù hợp.
  • Dùng phương thức .apply() để gọi return_minutes() trên mọi hàng của cột length_of_time.
  • In .head() của cả hai cột length_of_time và minutes để so sánh.