1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. ETL và ELT với Python

Connected

Bài tập

Áp dụng các phép biến đổi nâng cao cho DataFrame

pandas có rất nhiều công cụ biến đổi dựng sẵn, nhưng đôi khi bạn cần áp dụng logic nâng cao hơn trong quá trình biến đổi. Hàm apply cho phép bạn áp dụng một hàm do người dùng định nghĩa lên từng hàng hoặc cột của DataFrame, mở ra khả năng cho các phép biến đổi nâng cao và tạo đặc trưng.

Hàm find_street_name() sẽ tách tên đường từ "street_address", loại bỏ số nhà khỏi chuỗi. Hàm này đã được nạp vào bộ nhớ và sẵn sàng áp dụng lên DataFrame raw_testing_scores.

Hướng dẫn

100 XP
  • Trong phần định nghĩa hàm transform(), dùng hàm find_street_name() để tạo một cột mới tên "street_name".
  • Dùng hàm transform() để làm sạch DataFrame raw_testing_scores.
  • In phần đầu của DataFrame cleaned_testing_scores để quan sát cột "street_name" mới.