1. Учиться
  2. /
  3. Courses
  4. /
  5. R로 배우는 웹 스크레이핑

Connected

Exercise

하이퍼링크를 데이터 프레임으로 파싱하기

다음의 ul 형태로 된 "helpful links" 목록을 살펴보세요.

이 목록은 세 개의 li 요소로 이루어져 있으며, 각각의 li 안에는 링크를 담은 a 요소가 들어 있습니다:


Helpful links

  • Wikipedia
  • Dictionary
  • Search Engine

Compiled with help from Google.


해당 HTML 코드는 문자열로 hyperlink_raw_html에 저장되어 있어요.

이 연습 문제에서는 li 요소 안에 있는 a 요소만 선택해, 이 링크들을 R 데이터 프레임으로 파싱해 보겠습니다.

PS: 이를 위해 Tidyverse의 함수인 tibble()을 사용할 거예요. tibble()은 여러분이 이미 잘 아는 data.frame()을 간소화한 버전이라고 생각하시면 됩니다. data.frame()처럼 컬럼 이름과 데이터를 이름-값 쌍으로 지정합니다. 예시는 다음과 같아요:

my_tibble <- tibble(
  column_name_1 = value_1,
  column_name_2 = value_2,
  ...
)

Инструкции 1 / 2

undefined XP
    1
    2
  • html_elements()를 사용해 글머리표 목록 안에 있는 모든 a 노드를 추출하세요.