1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶWebスクレイピング

Connected

演習

Start Requests から始める

前のレッスンでは、scrapy スパイダー内で start_requests メソッドを設定する方法を学びました。ここでは、実際には何もスクレイピングしないお試し用のスパイダーを使いますが、start_requests メソッドを練習できます。目的は、start_requests 内で scrapy.Request を呼び出す際に渡す引数に慣れていただくことです。

これまでと同様に、start_requests で yield している内容を確認するための関数 inspect_class を用意しています。

指示

100 XP
  • scrapy スパイダーを作成するために必要な scrapy のオブジェクトを、クラス YourSpider に記入してください。
  • start_requests メソッド内で yield する scrapy.Request 呼び出しの空欄を埋め、スパイダーがスクレイピングを開始する URL を "https://www.datacamp.com" にし、ウェブサイトの解析には(YourSpider クラス内の)parse メソッドを使うようにしてください。