1. เรียนรู้
  2. /
  3. Courses
  4. /
  5. purrr で学ぶ中級関数型プログラミング

Connected

Exercises

プロフィールを特定する

引き続き、ツイートのデータセットを探索します。これらの要素は 5055 個のサブリストからなる入れ子リストに格納されており、purrr を使って調べていきます。

この演習では、ユーザーの行動に関する次の問いに答えます。オリジナルの「自分の投稿」を一度もせず、リツイートしかしていないユーザーは何人いますか? Twitter では経験則として、パレートの法則に従い、およそ 80% の人はリツイートのみ、20% はコンテンツを投稿すると言われます。これを検証してみましょう。

そのために、データセットを 2 つに分割し、ユーザーの総数と、「リツイートのみ」グループにいるユーザー数を数えます。

purrr はすでに読み込まれており、rstudioconf リストもワークスペースで利用できます。

คำแนะนำ

100 XP
  • リツイートのサブリストを作成し、user_id 要素を抽出し、unique() で重複を取り除きます。

  • オリジナルツイートのサブリストを作成し、user_id 要素を抽出し、unique() で重複を取り除きます。

  • 合計のユーザー数を知るために、union()(base R)と length() を組み合わせます。

  • リツイートのサブリストのみにいるユーザーを得るには、setdiff()(base R)を使います。