1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 하는 웹 스크레이핑

Connected

연습 문제

모든 단계의 텍스트

이번 연습은 이전 문제와 비슷하지만, 지정한 요소의 여러 세대에 걸친 텍스트를 선택한다는 점이 다릅니다.

특정 문단 p 요소의 텍스트를 가리키는 XPath와 CSS Locator 문자열을 작성하실 거예요. HTML에서 해당 p 요소는 id 속성이 "p3"로 유일하게 정의되어 있습니다. 이 정보만으로도 원하는 문자열을 만들 수 있지만, 참고하시라고 이 링크가 포함된 HTML 문자열을 변수 html에 미리 담아두었습니다.

이 연습에서는 해당 요소 내부의 텍스트 중, 이후 하위 세대에 포함된 모든 텍스트를 포함하는 선택만 하시면 됩니다. 어떤 요소를 가리키는지 비교해 볼 수 있도록 print_results 함수를 준비해 두었습니다.

지침

100 XP
  • 변수 xpath에, id가 p3인 문단 p 요소 내부의 텍스트를 가리키는 XPath 문자열을 할당하세요. 이때 이 p 요소의 이후 세대 텍스트까지 포함해야 합니다.
  • 변수 css_locator에, 동일한 텍스트를 가리키는 CSS Locator 문자열을 할당하세요.