1. Aprende
  2. /
  3. Cursos
  4. /
  5. R로 배우는 웹 스크레이핑

Connected

Ejercicio

ID의 고유성을 활용하세요

아시다시피, ID는 웹 페이지 전체에서 고유해야 해요. 이 점을 보장할 수 있다면, 스크레이핑에 쓰는 선택자의 복잡도를 크게 줄일 수 있어요.

다음은 실제 웹에서 마주칠 수 있는 HTML 구조예요:

<html>
  <body>
    <div id = 'first'>
      <h1 class = 'big'>Joe Biden</h1>
      <p class = 'first blue'>Democrat</p>
      <p class = 'second blue'>Male</p>
    </div>
    <div id = 'second'>...</div>
    <div id = 'third'>
      <h1 class = 'big'>Donald Trump</h1>
      <p class = 'first red'>Republican</p>
      <p class = 'second red'>Male</p>
    </div>
  </body>
</html>

read_html()로 이미 읽어 두었고, structured_html로 사용할 수 있어요.

Instrucciones

100 XP
  • html_elements()를 사용해 structured_html에서 첫 번째 div를 선택하는 가장 짧은 선택자를 찾으세요.