1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 소셜 미디어 데이터 분석하기

Connected

연습 문제

키워드 찾기

트위터 데이터셋에서 텍스트 데이터를 분석할 때 가장 먼저 할 수 있는 방법 중 하나는 이미 알려진 키워드를 세는 것입니다. 이 데이터셋에서는 데이터 사이언스에 관한 트윗 모음에서 특정 해시태그가 등장한 횟수를 셀 거예요. 이를 위해 pandas의 Series 객체에서 제공하는 문자열 메서드를 사용합니다.

pandas와 numpy는 각각 pd, np로 임포트되어 있습니다. 기능을 확장한 flatten_tweets와 data_science_json도 미리 로드되어 있어요.

지침

100 XP
  • flatten_tweets()로 트윗을 평탄화하여 flat_tweets에 저장하세요.
  • pandas DataFrame 생성자를 사용해 트윗을 DataFrame으로 변환하세요.
  • 대소문자를 구분하지 않고 'text'에서 #python 언급을 찾으세요.
  • np.sum()으로 python을 합산한 뒤 전체 트윗 수로 나눠, #python을 언급한 트윗의 비율을 출력하세요.