1. 学习
  2. /
  3. 课程
  4. /
  5. Python으로 배우는 Sentiment Analysis

Connected

练习

첫 번째 TfIdf

이 연습 문제에서는 레프 톨스토이의 『안나 카레니나』 첫 문장이 담긴 소규모 데이터셋 annak에 TfIdf 방법을 적용해 보겠습니다.

여러분의 과제는 이 데이터셋에 TfidfVectorizer() 함수를 적용하는 거예요. 텍스트를 수치로 변환하는 작업은 텍스트의 감성을 이해하기 위한 첫 단계라는 점을 기억하세요. Tfidf 벡터라이저는 감성 열에서 어휘 사전을 구성하는 또 다른 방법입니다.

说明

100 XP
  • sklearn.feature_extraction.text에서 TfIdf 벡터라이저를 만드는 함수를 가져오세요.
  • TfidfVectorizer() 함수를 호출해 annak 데이터셋에 맞춰 학습(fit)하세요.
  • 학습한 벡터라이저로 변환(transform)하세요.