1. Lära sig
  2. /
  3. Courses
  4. /
  5. Rで学ぶWebスクレイピング

Connected

exercise

XPATHでclassとIDで選択する

前の章で見かけたものに似たHTMLコードがあります(すでに weather_html というHTMLドキュメントに読み込まれています)。

<html>
  <body>
    <div id = 'first'>
      <h1 class = 'big'>Berlin Weather Station</h1>
      <p class = 'first'>Temperature: 20°C</p>
      <p class = 'second'>Humidity: 45%</p>
    </div>
    <div id = 'second'>...</div>
    <div id = 'third'>
      <p class = 'first'>Sunshine: 5hrs</p>
      <p class = 'second'>Precipitation: 0mm</p>
    </div>
  </body>
</html>

この章では、より実際のHTMLに近い例を扱います。目標は、この観測所から降水量の値を取り出すことです。残念ながら、IDで直接参照することはできません。

そこで、ステップごとに土台を作り、最後にそれらを組み合わせて使っていきましょう!

Instruktioner 1 / 4

undefined XP
  • 1
    • ウォームアップとして、上のHTMLからXPATHで全ての p タグを選択してください。
  • 2
    • 次に、class が second の p 要素だけを選択しましょう。
  • 3
    • 次に、ID が third の要素の子である p 要素をすべて選択してください。
  • 4
    • 最後に、XPATHを使って、#third の直下にある、class が second の p 要素「だけ」を選択してください。