1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 배우는 NLP 피처 엔지니어링

Connected

연습 문제

줄거리 추천 엔진

이 연습 문제에서는 줄거리의 유사성을 바탕으로 영화를 추천하는 추천 엔진을 만들어 보겠습니다. 이미 제공된 get_recommendations() 함수는 영화 제목, 유사도 행렬, 그리고 indices 시리즈를 인자로 받아 가장 유사한 영화 목록을 출력합니다. indices 는 이미 제공되어 있어요.

또한 여러 영화의 줄거리를 담은 movie_plots 시리즈가 제공됩니다. 여러분의 과제는 이 줄거리들의 tf-idf 벡터에 대한 코사인 유사도 행렬을 생성하는 것입니다.

마지막으로, 제가 좋아하는 영화 중 하나인 The Dark Knight Rises에 대한 추천 결과를 생성해 엔진의 성능을 확인해 보겠습니다.

지침

100 XP
  • 영어 stop_words 로 TfidfVectorizer 를 초기화하세요. 이름은 tfidf 로 하세요.
  • fit_transform() 을 사용해 영화 줄거리 데이터를 학습·변환하여 tfidf_matrix 를 만드세요.
  • tfidf_matrix 로 코사인 유사도 행렬 cosine_sim 을 생성하세요. cosine_similarity() 는 사용하지 마세요!
  • get_recommendations() 를 사용해 'The Dark Knight Rises' 의 추천 결과를 생성하세요.