Gradient Boosting 기반 베이스라인

이번에는 Random Forest를 기반으로 최종 베이스라인을 만들어 봅시다. 영상에서 보셨듯이, 그룹화 기반 베이스라인에서 Gradient Boosting으로 바꾸면 점수가 크게 향상됐습니다. 이제 sklearn의 Random Forest를 사용해 점수를 더 끌어올려 보겠습니다.

이 연습의 목표는 수치형 특징만 사용해 튜닝 없이 Random Forest 모델을 학습하는 것입니다. 그런 다음 테스트 데이터에 대해 예측을 만들고 Public Leaderboard에서 결과를 확인해 볼 수 있어요. 참고로 이미 "hour" 특징을 만들어 두었고, 이 역시 모델의 입력으로 사용할 수 있습니다.