1. 학습
  2. /
  3. 강의
  4. /
  5. Uczenie maszynowe z caret w R

Connected

연습 문제

Łączenie metod preprocessingu

Argument preProcess funkcji train() nie ogranicza się wyłącznie do uzupełniania brakujących wartości. Oferuje również wiele innych technik preprocessingu, które znacznie ułatwiają pracę w roli analityka danych. Pełną listę dostępnych metod znajdziesz, wpisując ?preProcess i przeglądając stronę pomocy tej funkcji.

Szczególnie przydatnym zestawem funkcji preprocessingu przy dopasowywaniu modeli regresji jest standaryzacja: centrowanie i skalowanie. Najpierw centrujesz dane – odejmujesz średnią każdej kolumny od każdej wartości w tej kolumnie, a następnie skolujesz – dzielisz przez odchylenie standardowe.

Standaryzacja przekształca dane tak, że dla każdej kolumny średnia wynosi 0, a odchylenie standardowe 1. Dzięki temu modele regresji łatwiej znajdują dobre rozwiązanie.

지침 1/2

undefined XP
  • 1

    W środowisku pracy masz załadowane breast_cancer_x i breast_cancer_y. Dopasuj model regresji logistycznej z imputacją medianą i zapisz go jako model na danych dotyczących raka piersi, a następnie wyświetl go w konsoli.

  • 2

    Zaktualizuj model, dodając dwa kolejne kroki preprocessingu: centrowanie i skalowanie.