1. 学ぶ
  2. /
  3. コース
  4. /
  5. Rで学ぶ中級正規表現

Connected

演習

より大きなデータセットで「OR パターン」を使う

ベクトルから複数の候補を連結する考え方がわかったところで、もう一歩進めてこれをより大きなデータセットに適用します。グローバルスコープには 2 つの変数 articles と politicians が用意されています。前者はスイスの政治に関するニュース記事のコレクション、後者は記事に登場するスイスの政治家名のリストです。

ここでは、どの名前がどの記事に現れるのか、そして各政治家がすべての記事で何回登場するのかを調べてください。

指示

100 XP
  • ベクトル politicians を使って、そのベクトルに含まれるすべての名前にマッチする正規表現を作成します。
  • データフレーム articles に、新しい列を作成し、列 text に現れるすべての政治家名を格納します。
  • すべての記事を結合して、政治家ごとの出現回数を数えやすくします。
  • パターンとしてベクトル politicians を使い、str_count() に渡します。