Veriyi hazırlama
Önceki bölümlerden farklı olarak, veriyi gözetimsiz öğrenme için biz hazırlamıyoruz; bu bölümün amacı seni daha gerçekçi ve eksiksiz bir iş akışında adım adım ilerletmek.
Videodan hatırlarsan, ilk adım veriyi indirmek ve hazırlamaktır.
Bu egzersiz
R ile Denetimsiz Öğrenme
kursunun bir parçasıdırEgzersiz talimatları
- Veriyi içeren CSV (virgülle ayrılmış değerler) dosyasını verilen URL'den indirmek için
read.csv()fonksiyonunu kullan. Sonucuwisc.df'ye ata. - Verinin özelliklerini (3 ile 32. sütunlar)
as.matrix()ile matrise çevir. Bunuwisc.dataadlı bir değişkende sakla. wisc.data'nın satır adlarını, şu andawisc.dfiçindekiidsütununda bulunan değerlerle ayarla. Bu zorunlu olmasa da, modelleme süreci boyunca farklı gözlemleri takip etmene yardımcı olacaktır.- Son olarak,
diagnosisadlı bir vektörü, tanı malign ise ("M")1, değilse0olacak şekilde ayarla. R'ninTRUE'yu 1'e,FALSE'u 0'a dönüştürdüğünü unutma.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
url <- "https://assets.datacamp.com/production/course_1903/datasets/WisconsinCancer.csv"
# Download the data: wisc.df
# Convert the features of the data: wisc.data
# Set the row names of wisc.data
row.names(wisc.data) <- wisc.df$___
# Create diagnosis vector
diagnosis <- as.numeric(wisc.df$diagnosis == ___)