1. 학습
  2. /
  3. 강의
  4. /
  5. Intermediate Importing Data in Python

Connected

연습 문제

BeautifulSoup으로 웹페이지를 데이터로 변환하기: 텍스트 추출

약속드린 대로, 다음 연습 문제에서는 HTML soup에서 정보를 추출하는 기본기를 배워 볼 거예요. 이 연습 문제에서는 BDFL의 웹페이지에서 텍스트를 추출하고, 웹페이지의 제목을 출력하는 방법을 익혀 봅니다.

지침

100 XP
  • 샘플 코드에서 HTML response object html_doc는 이미 생성되어 있어요. 먼저 BeautifulSoup() 함수를 사용해 이를 soup으로 만들고, 결과를 변수 soup에 할당하세요.
  • HTML soup soup에서 title 속성을 사용해 제목을 추출하고, 결과를 guido_title에 할당하세요.
  • print() 함수를 사용해 Guido의 웹페이지 제목을 셸에 출력하세요.
  • HTML soup soup에서 get_text() 메서드로 텍스트를 추출해 guido_text에 할당하세요.
  • Submit을 눌러 Guido의 웹페이지 텍스트를 셸에 출력하세요.