1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶWebスクレイピング

Connected

演習

Response から見破る

秘密のウェブサイトのコンテンツを読み込んだ Response オブジェクト(名前は response)をあらかじめ用意しています。あなたの仕事は、この response 変数を使ってウェブサイトの URL とタイトルを特定することです。URL の見つけ方は前のレッスンで学びました。サイトのタイトルを見つけるには、次のことを知っておく必要があります。

  • タイトルは title 要素のテキストです
  • title 要素は head 要素の子で、head 要素は html ルート要素の子です。

補足:html ルート要素には子の head 要素が 1 つだけ、そしてその head 要素には子の title 要素が 1 つだけあります。

指示

100 XP
  • 変数 this_url に、response 変数を読み込むために使われた URL を代入してください。
  • 変数 this_title に、response 変数を読み込むために使われたウェブサイトのタイトルを代入してください。単一の要素からテキストだけを取得したいので、テキストの抽出には extract_first() メソッドを使います。
  • _xpath_ でも _css_ でもかまいませんが、必ず title 要素そのものではなく、その要素内の**テキスト**を選択してください。