1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Ghép nối dữ liệu bằng Pandas dành cho người dùng bảng tính

Connected

Bài tập

Viết mã đơn giản cho các phép gộp phức tạp

Tin tuyệt vời! Bạn có quyền truy cập dữ liệu Next Gen Stats (NGS) của giải đấu. NGS ghi lại vị trí và hướng di chuyển của mọi cầu thủ ở mỗi pha bóng. Dữ liệu được ghi 10 lần mỗi giây, nghĩa là chỉ riêng các pha đá phạt punt đã có hơn 1,5 triệu quan sát mỗi tuần! Dữ liệu này đã được nạp vào một data frame tên là coords.

Bạn cũng có dữ liệu tổng quan về mỗi pha punt tương ứng với các pha được NGS theo dõi. Các dòng trong data frame này, tên là punts, được xác định bằng tổ hợp duy nhất của GameKey và PlayId.

Nếu ghép dữ liệu trong môi trường bảng tính, bạn sẽ tạo một cột ở mỗi bảng kết hợp GameKey và PlayId, rồi khớp hai bảng dựa trên cột mới đó. Ở đây, bạn có thể thử một câu lệnh merge đơn giản để nối punts và coords.

Hướng dẫn

100 XP
  • Xem 10 dòng đầu của punts. Lưu ý rằng mỗi dòng là duy nhất cho từng tổ hợp GameKey-PlayId.
  • Xem 10 dòng đầu của coords.
  • Gộp hai data frame với punts là data frame bên trái và coords là data frame bên phải.
  • Xem 15 dòng đầu của data frame mới, punts_w_coords.