1. 学ぶ
  2. /
  3. コース
  4. /
  5. Python으로 하는 웹 스크레이핑

Connected

演習

캡스톤 크롤러

이 연습 문제는 지금까지 배운 내용을 마음껏 보여 주는 자리예요! 이 문제에서는 스파이더의 parse 함수를 작성하고, 이어서 몇 가지 빈칸을 채워 스파이더를 완성하겠습니다. DataCamp의 강의 디렉터리 페이지에서 각 강의에는 제목과 짧은 강의 설명이 있습니다. 이 스파이더는 강의 디렉터리를 스크레이핑하여 강의 제목과 짧은 강의 설명을 추출하는 데 사용돼요. 이번에는 링크를 따라갈 필요가 없습니다. 알아두셔야 할 것은 다음과 같습니다:

  • 강의 제목은 클래스에 문자열 block__title(밑줄 두 개)이 포함된 h4 요소 내부의 텍스트로 정의됩니다.
  • 짧은 강의 설명은 클래스에 문자열 block__description(밑줄 두 개)이 포함된 문단 p 요소 내부의 텍스트로 정의됩니다.

指示1 / 2

undefined XP
    1
    2
  • 변수 crs_titles에 DataCamp 강의 디렉터리 페이지에서 추출한 강의 제목 리스트를 할당하세요. XPath에서 contains 호출을 사용하고, 선택한 객체의 텍스트를 가리키도록 XPath 문자열을 작성해야 합니다.
  • 변수 crs_descrs에 추출한 짧은 강의 설명 리스트를 할당하세요. XPath에서 contains 호출을 사용해야 합니다. 또한 선택한 객체의 텍스트를 가리키도록 XPath 문자열을 작성해야 합니다.

(추출한 데이터의 리스트가 필요하므로 extract_first()가 아니라 extract()를 사용합니다.)