1. Учиться
  2. /
  3. Courses
  4. /
  5. Python으로 Kaggle 대회 공략하기

Connected

Exercise

날짜 특징

숫자형 변수를 사용해 기본적인 특징을 만들어 보셨죠. 이제 날짜와 시간을 기반으로 한 특징을 만들어 볼 차례예요. 연습에는 Kaggle Taxi Fare Prediction 대회의 데이터 일부를 사용합니다. 이 데이터는 택시 이동에 대한 정보를 담고 있으며, 각 이동의 요금을 예측하는 것이 목표예요.

이번 과제의 목표는 픽업 시각에서 날짜 관련 특징을 생성하는 것입니다. 학습용 데이터와 테스트용 데이터에 대해 새 특징을 동시에 만드는 편이 더 좋다는 점을 기억하세요. 특징을 만든 뒤에는 데이터를 다시 학습용과 테스트용 DataFrame으로 나눕니다. 여기서는 pandas의 isin() 메서드를 사용해 분할해요.

train과 test DataFrame은 이미 작업 공간에 준비되어 있어요.

Инструкции

100 XP
  • train과 test DataFrame을 하나로 이어 붙여 단일 DataFrame taxi를 만드세요.
  • "pickup_datetime" 열을 datetime 객체로 변환하세요.
  • "pickup_datetime" 열에서 요일(.dayofweek 속성 사용)과 시각(시간, .hour 속성 사용) 특징을 만드세요.