1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Tiền xử lý cho Machine Learning bằng Python

Connected

Bài tập

Trích xuất mẫu chuỗi

Cột Length trong tập dữ liệu hiking là một cột chuỗi, nhưng bên trong đó có chứa số dặm của chuyến đi bộ. Chúng ta sẽ trích xuất số dặm này bằng biểu thức chính quy (regular expressions), rồi dùng một lambda trong pandas để áp dụng việc trích xuất cho toàn bộ DataFrame.

Hướng dẫn

100 XP
  • Tìm kiếm số nguyên và số thập phân trong văn bản của tham số length bằng một mẫu phù hợp.
  • Trích xuất mẫu khớp và chuyển nó thành float.
  • Áp dụng hàm return_mileage() cho từng hàng trong cột hiking["Length"].