1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶWebスクレイピング

Connected

演習

ペンネーム

この演習では、完成すると DataCamp のコースディレクトリを短縮したページから著者名を取得するスパイダー・クラスを用意しています。短縮版のURLは変数 url_short に保存されています。あなたの役割は、スパイダーの parse メソッド内で、著者名を抽出してリストにすることです。

知っておくべき点は2つあります。

  • ここでは response オブジェクトと css メソッドを使用します。
  • コースの著者名は、クラス course-block__author-name に属する段落 p 要素内のテキストとして定義されています。

用意した関数 inspect_spider() を使ってスパイダーを確認できます。見つけた著者名を出力します!

この章の本演習および以降の演習は、読み込みに少し時間がかかる場合があります。

指示

100 XP
  • start_requests メソッドで呼び出されたときに正しく動作するよう、parse メソッドに必要な引数を補ってください。
  • parse メソッド内で、クラス course-block__author-name に属する段落要素からテキストを抽出して作成した文字列のリスト author_names を作成してください。