1. 学ぶ
  2. /
  3. コース
  4. /
  5. R로 배우는 웹 스크레이핑

Connected

演習

position() 함수 익히기

영상에서 보셨듯이, position() 함수는 술어 내부에서 사용할 때 매우 강력합니다. 연산자와 함께 쓰면, 특정 경로와 일치하는 노드들 중에서 사실상 어떤 노드든 선택할 수 있어요.

rules_html을 통해 제공되는 다음 HTML 발췌본으로 연습해 보겠습니다. 이 예시는 특정 날짜와 그다음 날의 코로나바이러스 수칙을 계속 업데이트하는 웹사이트라고 가정해 볼게요.

...
<div>
  <h2>Today's rules</h2>
  <p>Wear a mask</p>
  <p>Wash your hands</p>
</div>
<div>
  <h2>Tomorrow's rules</h2>
  <p>Wear a mask</p>
  <p>Wash your hands</p>
  <small>Bring hand sanitizer with you</small>
</div>
...

指示1 / 3

undefined XP
  • 1
    • 먼저, XPATH로 각 div에서 두 번째 p의 텍스트를 추출하세요.
  • 2
    • 이제 각 div에서 두 번째 것을 제외한 모든 p의 텍스트를 추출하세요.
  • 3
    • 두 번째 div의 마지막 세 자식 노드의 텍스트를 추출하세요.
    • 이 자식 노드들을 선택할 때는 >= 연산자를 사용하세요.