1. 学ぶ
  2. /
  3. コース
  4. /
  5. Rで学ぶWebスクレイピング

Connected

演習

子孫直下のみを子セレクタで選択する

ここまでで、型、クラス、あるいはIDで要素を選択する方法は理解できているはずです。ただし、これらのセレクタではうまくいかない場合があります。たとえば、最上位の ul 要素の直下の子要素だけを抽出したい場合です。そのためには、動画で紹介した子セレクタ(>)を使います。

ここでは、languages_html ドキュメントに含まれる、言及されたコンピュータ言語のリストをスクレイピングします。ただし、サブの箇条書きにある付随情報は含めません。

  <ul id = 'languages'>
    <li>SQL</li>
    <ul>    
      <li>Databases</li>
      <li>Query Language</li>
    </ul>
    <li>R</li>
    <ul>
      <li>Collection</li>
      <li>Analysis</li>
      <li>Visualization</li>
    </ul>
    <li>Python</li>
  </ul>

指示1 / 2

undefined XP
  • 1

    まず、上の入れ子になったリスト内の li 要素をすべて集めて、そのテキストを出力します。

  • 2

    先ほどと異なり、子セレクタを使って、最上位の ul 要素の直下の子要素だけを抽出してみましょう。