1. Learn
  2. /
  3. Courses
  4. /
  5. purrr で学ぶ中級関数型プログラミング

Connected

Exercise

URLの分析

RStudioConf データセットの探索を引き続き進めます。この演習では、ツイートに含まれるURLの分析に集中します。

URLは "url_urls" という要素にあります。各 "url_urls" 要素には、ツイートにURLがない場合は NULL、ある場合は1つ以上のURLからなるリストが入っています。

まずデータセットからすべての "url_urls" 要素を抽出し、その後 purrr と stringr を組み合わせて、GitHub 関連のURLへのリンクを含むツイートがいくつあるかを数えます。GitHub は開発者に人気のサイトなので、このサイトの出現率が高ければ、このデータセットに開発者コミュニティが強く存在していることを示唆します。

purrr と stringr は読み込まれており、rstudioconf データセットもワークスペースに用意されています。

Instructions

100 XP
  • すべての "urls_url" 要素を抽出し、結果を flatten() に渡して階層を1段取り除きます。

  • 結果から NULL を取り除きます。

  • 文字列に "github" が含まれるかを検出するマッパー has_github を作成します。

  • 論理値用の map_*() バリアントで has_github を適用し、sum() に渡して "github" を含むリンクの数を数えます。