1. सीखें
  2. /
  3. पाठ्यक्रम
  4. /
  5. purrr로 배우는 중급 함수형 프로그래밍

Connected

अभ्यास

read_lines()의 possibly() 버전

여전히 스크레이핑할 URL 목록을 사용하고 있어요. 접근할 수 없는 URL을 식별하기 위해 여러 방법을 시도해 보겠습니다. 왜 그럴까요? 웹 스크레이핑의 첫 단계는 해당 URL에 접근할 수 있는지 확인하는 일이기 때문이에요. 지금 작성하는 코드는 바로 그 목적에 유용하게 쓰입니다.

이전 연습 문제에서는 read_lines() 함수를 safely()로 감쌌어요. 이번에는 possibly() 함수를 사용해 보겠습니다.

웹 용어에서 404는 웹 페이지를 사용할 수 없음을 나타냅니다. 이 숫자를 otherwise 인수로 사용할 거예요.

또한 read_lines()는 웹페이지를 읽으면 길이 n의 벡터를 반환하므로, paste() 함수를 사용해 이를 하나로 이어붙일 거예요.

urls 벡터는 이미 제공되어 있습니다.

निर्देश

100 XP
  • read_lines() 함수를 possibly()로 감싸서, 실패 시 404를 반환하도록 하세요.

  • 방금 만든 함수를 URL 리스트에 map으로 적용하고, 바로 set_names()로 파이프하세요.

  • 리스트의 각 요소를 길이 1의 문자열로 만들기 위해 paste() 함수를 사용하고, collapse 인수는 " "로 설정하세요.

  • 값이 404와 같은 요소만 남기세요.