1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 배우는 Sentiment Analysis

Connected

연습 문제

영화 리뷰로 워드클라우드 만들기

여러분은 지금까지 영화 리뷰 데이터셋으로 작업해 왔어요. 리뷰의 분포를 살펴보고, 가장 긴 리뷰와 가장 짧은 리뷰의 길이도 확인했죠. 그렇다면 긍정 리뷰와 부정 리뷰에서는 각각 어떤 내용을 이야기할까요?

이번 연습에서는 상위 100개의 긍정 리뷰로 워드클라우드를 만들어 보겠어요.

어떤 단어들이 눈에 띄나요? 여러분이 보기에도 의미가 있나요?

문자열 descriptions는 상위 100개 긍정 리뷰의 설명을 이어 붙여서 미리 만들어 두었어요. 영화 도메인에 특화된 불용어(매우 자주 등장하지만 정보량이 낮아 그래프에서 제외하고 싶은 단어, 예: the, a/an, and) 집합은 my_stopwords로 제공돼요. interpolation 인자는 워드클라우드가 더 부드럽게 보이도록 해 준다는 점을 기억하세요.

지침

100 XP
  • 해당 패키지에서 wordcloud 함수를 import하세요.
  • descriptions 문자열에 워드클라우드 함수를 적용하세요. 배경색은 'white'로 설정하고, stopwords 인자를 변경하세요.
  • 워드클라우드 이미지를 생성하세요.
  • 마지막으로, 이미지를 화면에 표시하는 것을 잊지 마세요.