別の抽出器

前の演習では、H2 ヘッダーからテキストコンテンツを抽出する関数を作成しました。

ここでは別のことを試します。特定のページに存在するすべてのリンクを抽出したいとします。これを行うには、2つの httr 関数を呼び出す必要があります。html_nodes() に css 引数として "a" を指定します（a はリンクを表すHTMLタグです）。さらに、ノードから特定の属性を抽出する html_attr() を使います。今回抽出する属性はリンク先を示す "href" です。

purrr と rvest は読み込まれています。ワークスペースには引き続き urls ベクターがあります。