1. เรียนรู้
  2. /
  3. Courses
  4. /
  5. Python으로 배우는 NLP 피처 엔지니어링

Connected

Exercises

TED 토크의 tf-idf 벡터

이 연습 문제에서는 500개의 TED 토크 전사본이 담긴 코퍼스 ted가 제공되어 있어요. 여러분의 과제는 이 토크들에 대한 tf-idf 벡터를 생성하는 거예요.

다음 레슨에서는 이 벡터를 활용해 전사본을 기준으로 유사한 토크를 추천해 볼 거예요.

คำแนะนำ

100 XP
  • sklearn에서 TfidfVectorizer를 임포트하세요.
  • TfidfVectorizer 객체를 생성하고 이름을 vectorizer로 지정하세요.
  • fit_transform() 메서드를 사용해 ted의 tfidf_matrix를 생성하세요.