1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 추천 엔진 만들기

Connected

연습 문제

TF-IDF DataFrame 만들기

이제 TF-IDF feature를 생성했으니, 추천을 만들 때 사용할 수 있는 형식으로 변환해야 해요. 이를 위해 다시 한 번 pandas를 사용해 배열을 DataFrame으로 감쌀 거예요. 데이터를 필터링할 때 영화 제목을 사용할 것이므로, DataFrame의 인덱스로 제목을 지정하면 됩니다.

df_plots DataFrame은 미리 로드되어 있어요. Title 열에는 영화 제목이, Plot 열에는 줄거리가 들어 있어요.

지침

100 XP
  • TfidfVectorizer를 생성한 뒤, 이전 연습 문제와 동일하게 fit과 transform을 수행하세요.
  • 생성된 vectorized_data를 DataFrame으로 감싸세요. 학습과 변환 단계에서 생성된 feature의 이름을 열 이름으로 사용하고, 새 DataFrame을 tfidf_df에 할당하세요.
  • 새로 만든 tfidf_df DataFrame의 인덱스에 원래 영화 제목을 지정하세요.