1. เรียนรู้
  2. /
  3. Courses
  4. /
  5. R로 배우는 Feature Engineering

Connected

Exercises

분석을 위한 데이터 준비하기

nycflights13 데이터셋의 한 버전이 flights로 로드되어 있습니다. 이 데이터에는 뉴욕시에서 출발하는 항공편 정보가 들어 있습니다. 목적지에 도착이 지연되는지 여부를 예측하고자 하지만, 먼저 분석을 위한 데이터 준비가 필요합니다.

전문가 팀과 모델 목표를 논의한 뒤, 모델에 사용할 변수로 다음을 선택했습니다: flight, sched_dep_time, dep_delay, sched_arr_time, carrier, origin, dest, distance, date, arrival.

또한 as.Date()로 날짜를 mutate()하고, 문자형 변수를 factor로 변환합니다.

마지막으로 데이터를 train과 test 데이터셋으로 분할합니다.

คำแนะนำ

100 XP
  • 모든 문자형 변수를 factor로 변환하세요.
  • flights 데이터를 train/test 세트로 분할하세요.