1. सीखें
  2. /
  3. पाठ्यक्रम
  4. /
  5. 효율적인 R 코드 작성

Connected

अभ्यास

CSV와 RDS 파일 읽기 시간 비교

가장 자주 하는 작업 중 하나는 CSV 파일에서 데이터를 읽어들이는 일입니다. 하지만 CSV 파일이 크면 속도가 느릴 수 있어요. 유용한 요령은 데이터를 한 번 읽은 뒤 R 바이너리 파일(rds)로 저장하는 것입니다. 이때는 saveRDS()를 사용합니다. rds 파일을 읽을 때는 readRDS()를 사용합니다.

참고: rds는 단일 객체를 저장하는 R의 기본 형식이므로, 앞으로 변경될 수도 있는 서드파티 의존성을 새로 도입하지 않게 됩니다.

두 접근 방식을 벤치마크하려면 system.time()를 사용할 수 있습니다. 이 함수는 어떤 R 표현식을 평가하는 데 걸린 시간을 반환합니다. 예를 들어 1부터 천만까지의 제곱근을 계산하는 데 걸리는 시간을 재려면 다음과 같이 작성합니다:

system.time(sqrt(1:1e7))

निर्देश

100 XP

"movies.csv"와 "movies.rds" 파일에는 45,000편 영화에 대한 동일한 데이터 프레임이 들어 있습니다.

  • system.time() 함수를 사용해 read.csv("movies.csv")로 CSV 파일을 읽는 데 걸리는 시간을 재보세요.
  • rds 파일 "movies.rds"도 readRDS()로 동일하게 측정해 보세요.