1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 배우는 NLP 피처 엔지니어링

Connected

연습 문제

TED 강연 추천기

이 연습 문제에서는 강연 대본을 기반으로 TED 강연을 추천하는 추천 시스템을 만들어 보겠습니다. 이미 제공된 get_recommendations() 함수는 강연 제목, 유사도 행렬, 그리고 indices 시리즈를 인수로 받아 가장 유사한 강연 목록을 출력합니다. indices는 이미 준비되어 있어요.

또한 약 500개의 TED 강연 대본이 담긴 transcripts 시리즈도 제공되었습니다. 여러분의 작업은 강연 대본의 tf-idf 벡터에 대해 코사인 유사도 행렬을 생성하는 것입니다.

마지막으로, 브라질 기업가 Bel Pesce의 '5 ways to kill your dreams'라는 제목의 강연에 대한 추천 결과를 생성해 보겠습니다.

지침

100 XP
  • 영어 불용어를 사용하는 TfidfVectorizer를 초기화하세요. 이름은 tfidf로 하세요.
  • transcripts에 대해 학습과 변환을 수행해 tfidf_matrix를 만드세요.
  • tfidf_matrix를 사용해 코사인 유사도 행렬 cosine_sim을 생성하세요.
  • get_recommendations()를 사용해 '5 ways to kill your dreams'의 추천 결과를 생성하세요.