1. Nauka
  2. /
  3. Kursy
  4. /
  5. Uczenie nienadzorowane w R

Connected

ćwiczenie

Przygotowanie danych

W poprzednich rozdziałach dane do uczenia bez nadzoru były już dla ciebie przygotowane. Celem tego rozdziału jest przeprowadzenie cię przez bardziej realistyczny i kompletny proces pracy.

Pamiętaj z materiału wideo, że pierwszym krokiem jest pobranie i przygotowanie danych.

Instrukcje

100 XP
  • Użyj funkcji read.csv(), aby pobrać plik CSV (wartości oddzielone przecinkami) z danymi spod podanego adresu URL. Wynik przypisz do zmiennej wisc.df.
  • Użyj as.matrix(), aby przekonwertować cechy z danych (kolumny od 3 do 32) na macierz. Zapisz wynik w zmiennej o nazwie wisc.data.
  • Przypisz nazwom wierszy wisc.data wartości aktualnie zawarte w kolumnie id ramki wisc.df. Nie jest to bezwzględnie wymagane, ale ułatwi śledzenie poszczególnych obserwacji podczas modelowania.
  • Na koniec ustaw wektor diagnosis tak, aby przyjmował wartość 1, gdy diagnoza jest złośliwa ("M"), i 0 w pozostałych przypadkach. Pamiętaj, że R zamienia TRUE na 1, a FALSE na 0.