1. 학습
  2. /
  3. 강의
  4. /
  5. Python에서의 앙상블 기법

Connected

연습 문제

영화 데이터베이스 소개

이번 장에서는 TMDb(The Movie Database) 데이터를 사용해요. 이 데이터에는 약 5,000편의 영화 메타데이터가 담겨 있어요.

데이터셋은 movies로 로드되어 있어 바로 사용할 수 있어요.

이번 과제의 핵심 목표는 영화의 수익(revenue), 좀 더 정확히는 정규화된 revenue 특성인 log-revenue를 예측하는 거예요.

히스토그램에 표시된 값이 담긴 변수 target을 .describe() 메서드로 살펴보세요. 오른쪽의 히스토그램도 함께 확인할 수 있어요. 무엇을 결론낼 수 있을까요?

지침

50 XP

가능한 답변