1. 学ぶ
  2. /
  3. コース
  4. /
  5. pandas로 데이터 재구조화하기

Connected

演習

중첩된 영화 데이터

컴퓨터에 한동안 보관해 둔 movies 데이터셋에는 여러 영화에 대한 정보가 들어 있어요. 이 데이터를 분석해 보려고 하지만, 살펴보니 중첩된 JSON 형식이네요.

이 데이터를 DataFrame으로 읽어들이려면 방금 배운 함수를 사용해야 해요. 그다음에는 다루기 쉽도록 결과 DataFrame을 다시 형태 변환할 거예요.

반정형 JSON인 movies가 제공되어 있어요. 콘솔에서 꼭 확인해 보세요!

指示

100 XP
  • pandas에서 json_normalize() 함수를 임포트하세요.
  • movies에 들어 있는 JSON을 정규화하세요. 중첩 레코드에서 생성된 이름은 밑줄로 구분하세요.
  • 생성된 movies_norm DataFrame을 wide 형식에서 long 형식으로 변환하세요. 고유 인덱스로는 director와 producer 열을 사용하세요. 열 movies에서 만들어지는 새로운 변수의 이름은 features로 시작하고, 밑줄로 구분되며, 접미사는 단어로 구성되도록 지정하세요.