1. 학습
  2. /
  3. 강의
  4. /
  5. R로 배우는 웹 스크레이핑

Connected

연습 문제

의사 클래스로 마지막 자식 선택하기

아래 HTML은 마지막 문단에 글쓴이를 표시하고 있으며, p 노드는 두 그룹으로 나뉘어 있어요:

<html>
  <body>
    <div>
      <p class = 'text'>A sophisticated text [...]</p>
      <p class = 'text'>Another paragraph following [...]</p>
      <p class = 'text'>Author: T.G.</p>
    </div>
    <p>Copyright: DC</p>
  </body>
</html>

이 연습에서는 div 내부의 마지막 p 노드를 선택해 보세요.

영상에서 배운 것처럼, 의사 클래스는 ID 선택자나 고유한 클래스처럼 특정 노드를 선택할 다른 수단이 없을 때 유용하게 쓸 수 있어요.

위 HTML 문서는 nested_html 변수로 제공되어 있으며, 이미 read_html()로 읽어 두었습니다.

지침 1/2

undefined XP
  • 1
    • 먼저, 자식 중에서 마지막 것을 선택하는 의사 클래스를 사용해 각 그룹에서 마지막 p를 스크레이프하세요.
  • 2
    • 위 방식은 두 그룹의 마지막 p를 모두 선택하므로, text 클래스를 함께 사용해 글쓴이 정보만 가져오세요.