1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 배우는 Sentiment Analysis

Connected

연습 문제

여러 개의 텍스트 열

이 연습 문제에서는 항공사 트위터 데이터 작업을 이어서 진행합니다. 데이터셋 tweets가 이미 로드되어 있어요.

어떤 경우에는 데이터셋에 텍스트 열이 둘 이상 있을 수 있고, 각 텍스트 열에 대해 숫자 표현을 만들고 싶을 때가 있습니다. 여기서는 트윗 본문이 들어 있는 text 열 외에 두 번째 텍스트 열 negativereason이 있습니다. 이 열에는 고객이 부정적인 리뷰를 남긴 이유가 들어 있습니다.

여러분의 과제는 두 열 모두에 대해 BOW 표현을 만들고, 필요한 불용어를 지정하는 것입니다.

지침

100 XP
  • 벡터화 패키지와 기본 영어 불용어 목록을 임포트하세요.
  • 기본 영어 불용어 목록을 업데이트하여 my_stop_words 집합을 만드세요.
  • 첫 번째 벡터라이저의 불용어 인자에는 업데이트된 집합을, 두 번째 벡터라이저에는 기본 영어 불용어 집합을 지정하세요.