Veriyi hazırlama
Önceki bölümlerden farklı olarak, veriyi gözetimsiz öğrenme için biz hazırlamıyoruz; bu bölümün amacı seni daha gerçekçi ve eksiksiz bir iş akışında adım adım ilerletmek.
Videodan hatırlarsan, ilk adım veriyi indirmek ve hazırlamaktır.
Bu egzersiz, kursun bir parçasıdır
R ile Denetimsiz Öğrenme
Egzersiz talimatları
- Veriyi içeren CSV (virgülle ayrılmış değerler) dosyasını verilen URL'den indirmek için
read.csv()fonksiyonunu kullan. Sonucuwisc.df'ye ata. - Verinin özelliklerini (3 ile 32. sütunlar)
as.matrix()ile matrise çevir. Bunuwisc.dataadlı bir değişkende sakla. wisc.data'nın satır adlarını, şu andawisc.dfiçindekiidsütununda bulunan değerlerle ayarla. Bu zorunlu olmasa da, modelleme süreci boyunca farklı gözlemleri takip etmene yardımcı olacaktır.- Son olarak,
diagnosisadlı bir vektörü, tanı malign ise ("M")1, değilse0olacak şekilde ayarla. R'ninTRUE'yu 1'e,FALSE'u 0'a dönüştürdüğünü unutma.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
url <- "https://assets.datacamp.com/production/course_1903/datasets/WisconsinCancer.csv"
# Download the data: wisc.df
# Convert the features of the data: wisc.data
# Set the row names of wisc.data
row.names(wisc.data) <- wisc.df$___
# Create diagnosis vector
diagnosis <- as.numeric(wisc.df$diagnosis == ___)