1. 학습
  2. /
  3. 강의
  4. /
  5. Pythonで学ぶWebスクレイピング

Connected

연습 문제

ハイパー(リンク)アクティブ

"web-crawling" において最も重要な属性のひとつは、a タグ内のハイパーリンク URL(href 属性)です。ここでは、そのハイパーリンクを抽出します。print_attribute 関数は、あなたの XPath で抽出したデータを表示するために用意しています。コンソールで XPath 文字列を試すこともできます。

この演習は次の HTML ソースコードを参照します:

<html>
  <body>
    <div id="div1" class="class-1">
      <p class="class-1 class-2">Hello World!</p>
      <div id="div2">
        <p id="p2" class="class-2">Choose 
            <a href="http://datacamp.com">DataCamp!</a>!
        </p>
      </div>
    </div>
    <div id="div3" class="class-2">
      <p class="class-2">Thanks for Watching!</p>
    </div>
  </body>
</html>

지침

100 XP
  • 空欄を埋めて、DataCamp のハイパーリンクから href 属性値を選択する変数 xpath を完成させてください。