1. Learn
  2. /
  3. Courses
  4. /
  5. Intermediate Importing Data in Python

Connected

Exercise

BeautifulSoup でウェブページをデータにする:テキストを取得する

この先の演習では、HTML スープから情報を抽出する基本を学びます。この演習では、BDFL のウェブページからテキストを抽出し、あわせてページタイトルを出力する方法を確認します。

Instructions

100 XP
  • サンプルコードでは、HTML レスポンスオブジェクト html_doc はすでに作成済みです。最初のタスクは、関数 BeautifulSoup() を使ってこれをスープ化し、得られたスープを変数 soup に代入することです。
  • HTML スープ soup から title 属性を使ってタイトルを抽出し、guido_title に代入します。
  • print() 関数を使って、Guido のウェブページのタイトルをシェルに出力します。
  • メソッド get_text() を使って HTML スープ soup からテキストを抽出し、guido_text に代入します。
  • Submit Answer を押して、Guido のウェブページのテキストをシェルに出力します。