1. 학습
  2. /
  3. 강의
  4. /
  5. pandas로 빠르고 간편한 데이터 적재

Connected

연습 문제

데이터프레임 병합하기

직전 연습 문제에서 Yelp 기준으로 뉴욕시 상위 100개 카페 데이터셋을 만들었어요. 이제 여기에 인구통계 데이터를 결합해, 인구 대비 좋은 카페가 가장 많은 동네가 어디인지 살펴보겠습니다.

이를 위해 DataFrame의 merge() 메서드로 두 개의 데이터셋을 병합할 거예요. 첫 번째인 crosswalk는 ZIP 코드와 공공용 마이크로데이터 표본 구역(PUMA, 인구조사 구역의 집합으로 대략 NYC 동네에 해당)을 연결해 주는 매핑 테이블입니다. 그다음 각 PUMA의 2016년 인구 추정치가 들어 있는 pop_data를 병합합니다.

pandas는 pd로 임포트되어 있고, 이전 연습 문제에서 만든 cafes 데이터프레임도 불러와져 있어요.

지침 1/3

undefined XP
    1
    2
    3

질문

콘솔에서 cafes와 crosswalk 데이터프레임을 탐색해 보세요. 어떤 열을 조인 키로 사용해야 할까요?

가능한 답변