1. Learn
  2. /
  3. Courses
  4. /
  5. R로 배우는 웹 스크레이핑

Connected

Exercise

XPATH으로 class와 ID로 선택하기

다음은 지난 장에서 보셨던 코드와 비슷한 HTML 코드입니다(이미 weather_html이라는 HTML 문서로 읽어 두었습니다):

<html>
  <body>
    <div id = 'first'>
      <h1 class = 'big'>Berlin Weather Station</h1>
      <p class = 'first'>Temperature: 20°C</p>
      <p class = 'second'>Humidity: 45%</p>
    </div>
    <div id = 'second'>...</div>
    <div id = 'third'>
      <p class = 'first'>Sunshine: 5hrs</p>
      <p class = 'second'>Precipitation: 0mm</p>
    </div>
  </body>
</html>

이번 장에서는 실제 웹페이지에 더 가까운 예제를 다룹니다. 목표는 이 기상 관측소에서 강수량(precipitation) 수치를 추출하는 것입니다. 아쉽게도 ID로는 직접 참조할 수 없어요.

기본 블록을 하나씩 쌓아 올린 뒤, 이를 조합해 해결해 보겠습니다!

Instructions 1/4

undefined XP
  • 1
    • 준비 운동으로, XPATH를 사용해 위 HTML의 모든 p 태그를 선택해 보세요.
  • 2
    • 이제 class가 second인 p 요소만 선택해 보세요.
  • 3
    • 이제 ID가 third인 요소의 자식인 모든 p 요소를 선택해 보세요.
  • 4
    • 이제 XPATH를 사용해 #third의 직접 자식 중 class가 second인 p 요소만 선택해 보세요.