1. Nauka
  2. /
  3. Kursy
  4. /
  5. Inżynieria cech w R

Connected

ćwiczenie

Przygotowanie danych do analizy

Przyjrzysz się wersji zbioru danych nycflights13, wczytanej jako flights. Zawiera on informacje o lotach odlatujących z Nowego Jorku. Celem jest przewidzenie, czy dany lot dotrze do miejsca docelowego z opóźnieniem – ale najpierw musisz przygotować dane do analizy.

Po omówieniu celów modelu z zespołem ekspertów wybrałeś następujące zmienne: flight, sched_dep_time, dep_delay, sched_arr_time, carrier, origin, dest, distance, date, arrival.

Następnie użyjesz mutate(), aby przetworzyć datę za pomocą as.Date(), oraz przekonwertujesz zmienne typu character na czynniki (factors).

Na koniec podzielisz dane na zbiór treningowy train i zbiór testowy test.

Instrukcje

100 XP
  • Przekształć wszystkie zmienne typu character na czynniki (factors).
  • Podziel zbiór danych flights na zbiór testowy i treningowy.