키워드 찾기

트위터 데이터셋에서 텍스트 데이터를 분석할 때 가장 먼저 할 수 있는 방법 중 하나는 이미 알려진 키워드를 세는 것입니다. 이 데이터셋에서는 데이터 사이언스에 관한 트윗 모음에서 특정 해시태그가 등장한 횟수를 셀 거예요. 이를 위해 pandas의 Series 객체에서 제공하는 문자열 메서드를 사용합니다.

pandas와 numpy는 각각 pd, np로 임포트되어 있습니다. 기능을 확장한 flatten_tweets와 data_science_json도 미리 로드되어 있어요.