1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 배우는 NLP 피처 엔지니어링

Connected

연습 문제

러시아 트윗의 문자 수

이 연습 문제에서는 FiveThirtyEight이 정리한, 러시아 Internet Research Agency와 관련된 일부 트윗을 담은 데이터프레임 tweets가 제공돼요.

여러분의 과제는 각 트윗의 문자 수를 계산해 tweets에 새 특성 'char_count'를 만드는 거예요. 또한 각 트윗의 평균 길이도 계산하세요. 트윗 본문은 tweets의 content 특성에 들어 있어요.

이 데이터는 실제 Twitter 데이터이므로, 비속어나 불쾌감을 줄 수 있는 표현이 포함될 수 있어요(이번 연습 문제뿐 아니라 실제 Twitter 데이터를 사용하는 이후 연습 문제에서도 마찬가지예요).

지침

100 XP
  • tweets의 'content' 특성에 len을 적용해 새 특성 char_count를 만드세요.
  • 'char_count' 특성의 평균을 계산해 트윗의 평균 문자 수를 출력하세요.