1. 学ぶ
  2. /
  3. コース
  4. /
  5. Rで始めるテキスト分析

Connected

演習

ユーザータイプのカウント

カテゴリーデータの基本的な要約はカウントです。テキストはカテゴリーデータとして扱うため、カウントの計算に慣れておくことが重要です。twitter_data には complaint_label 列で示される苦情と非苦情が含まれ、さらにユーザーが認証済みかどうか(つまり、Twitter によって本人確認されているか)が示される usr_verified 列もあります。この列の型は <lgl>(logical、論理型)である点に注意してください。認証済みユーザーのほうが苦情を投稿しがちでしょうか?

指示

100 XP
  • dplyr と ggplot2 を含む tidyverse パッケージを読み込みます。
  • データをフィルタして、苦情ツイートのみを残します。
  • 苦情を投稿した認証済みユーザーと未認証ユーザーの人数を数えます。