1. 학습
  2. /
  3. 강의
  4. /
  5. 스프레드시트 사용자를 위한 Pandas 조인

Connected

연습 문제

복잡한 머지를 간단한 코드로

좋은 소식입니다! 이제 리그의 Next Gen Stats 데이터(NGS)에 접근할 수 있어요. NGS는 매 플레이마다 모든 선수의 위치와 방향을 기록합니다. 데이터는 초당 10회 기록되며, 퍼트(punt)만 봐도 한 주에 150만 건이 넘는 관측치가 생깁니다! 데이터는 이미 coords라는 데이터 프레임으로 로드되어 있어요.

또한 NGS에서 추적한 퍼트와 대응되는, 모든 퍼트에 대한 일반적인 플레이 데이터도 있습니다. punts라는 데이터 프레임의 각 행은 GameKey와 PlayId의 고유 조합으로 식별됩니다.

스프레드시트 환경에서 데이터를 결합하려면 각 테이블에 GameKey와 PlayId를 결합한 열을 만들고, 이 새 열을 기준으로 테이블을 매칭했을 거예요. 여기서는 간단한 merge 문으로 punts와 coords를 조인해 보세요.

지침

100 XP
  • punts의 처음 10행을 확인하세요. 각 행은 GameKey-PlayId 조합별로 고유합니다.
  • coords의 처음 10행을 확인하세요.
  • 왼쪽 데이터 프레임은 punts, 오른쪽 데이터 프레임은 coords로 두고 두 데이터 프레임을 merge 하세요.
  • 새 데이터 프레임 punts_w_coords의 처음 15행을 확인하세요.