1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 배우는 NLP 피처 엔지니어링

Connected

연습 문제

TED 토크의 tf-idf 벡터

이 연습 문제에서는 500개의 TED 토크 전사본이 담긴 코퍼스 ted가 제공되어 있어요. 여러분의 과제는 이 토크들에 대한 tf-idf 벡터를 생성하는 거예요.

다음 레슨에서는 이 벡터를 활용해 전사본을 기준으로 유사한 토크를 추천해 볼 거예요.

지침

100 XP
  • sklearn에서 TfidfVectorizer를 임포트하세요.
  • TfidfVectorizer 객체를 생성하고 이름을 vectorizer로 지정하세요.
  • fit_transform() 메서드를 사용해 ted의 tfidf_matrix를 생성하세요.