1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 하는 웹 스크레이핑

Connected

연습 문제

하이퍼(링크) 활성화

"웹 크롤링"에서 가장 중요하게 추출해야 할 속성 중 하나는 a 태그 안의 하이퍼링크 url(href 속성)입니다. 여기서 바로 그 하이퍼링크를 추출해 볼 거예요! 콘솔에서 XPath 문자열을 시험해 볼 수 있도록, 여러분의 XPath로 추출된 데이터를 출력하는 print_attribute 함수를 만들어 두었습니다.

이 연습 문제는 다음 HTML 소스 코드를 참고합니다:

<html>
  <body>
    <div id="div1" class="class-1">
      <p class="class-1 class-2">Hello World!</p>
      <div id="div2">
        <p id="p2" class="class-2">Choose 
            <a href="http://datacamp.com">DataCamp!</a>!
        </p>
      </div>
    </div>
    <div id="div3" class="class-2">
      <p class="class-2">Thanks for Watching!</p>
    </div>
  </body>
</html>

지침

100 XP
  • 빈칸을 채워 아래 변수 xpath를 완성해 DataCamp 하이퍼링크의 href 속성 값을 선택하세요.