1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 배우는 Sentiment Analysis

Connected

연습 문제

불용어를 적용한 항공사 감성 분석

tweets라는 데이터셋에는 항공사에 대한 고객 리뷰와 감성 정보가 들어 있어요. 두 개의 열인 airline_sentiment와 text로 구성되며, 감성은 positive, negative, neutral 중 하나이고, text는 트윗 본문이에요.

이번 연습에서는 불용어를 고려하여 BOW 표현을 만들어요. 불용어는 정보량이 낮으므로 제거하는 편이 좋아요. 이렇게 하면 어휘 사전이 작아지고 결국 특성 수도 줄어들어요. 또한 기본 불용어 목록에 우리의 문맥에 특화된 단어를 추가해 확장할 수 있다는 점을 기억하세요.

지침

100 XP
  • 영어 기본 불용어 목록을 import 하세요.
  • 주어진 목록 ['airline', 'airlines', '@']을 기본 불용어 목록에 추가해 my_stop_words를 만드세요.
  • 벡터라이저에서 stop_words 인자를 지정하세요.