1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Rで学ぶWebスクレイピング

Connected

Bài tập

ハイパーリンクをデータフレームにパースする

次の「helpful links」のulリストを見てください。

これは3つのli要素で構成されており、それぞれにリンクを持つa要素が入っています。


Helpful links

  • Wikipedia
  • Dictionary
  • Search Engine

Compiled with help from Google.


対応するHTMLコードは、文字列としてhyperlink_raw_htmlに入っています。

この演習では、li要素内にあるa要素だけを選択して、これらのリンクをRのデータフレームにパースします。

PS: そのためにTidyverseの関数であるtibble()を使います。tibble()は、皆さんもご存じのdata.frame()を簡潔にしたような関数です。data.frame()と同様に、列名とデータを列名と値のペアで指定します。例:

my_tibble <- tibble(
  column_name_1 = value_1,
  column_name_2 = value_2,
  ...
)

Hướng dẫn 1/2

undefined XP
    1
    2
  • html_elements()を使って、箇条書きリスト内にあるaノードをすべて抽出してください。