BaşlayınÜcretsiz Başlayın

Veriyi hazırlama

Önceki bölümlerden farklı olarak, veriyi gözetimsiz öğrenme için biz hazırlamıyoruz; bu bölümün amacı seni daha gerçekçi ve eksiksiz bir iş akışında adım adım ilerletmek.

Videodan hatırlarsan, ilk adım veriyi indirmek ve hazırlamaktır.

Bu egzersiz

R ile Denetimsiz Öğrenme

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • Veriyi içeren CSV (virgülle ayrılmış değerler) dosyasını verilen URL'den indirmek için read.csv() fonksiyonunu kullan. Sonucu wisc.df'ye ata.
  • Verinin özelliklerini (3 ile 32. sütunlar) as.matrix() ile matrise çevir. Bunu wisc.data adlı bir değişkende sakla.
  • wisc.data'nın satır adlarını, şu anda wisc.df içindeki id sütununda bulunan değerlerle ayarla. Bu zorunlu olmasa da, modelleme süreci boyunca farklı gözlemleri takip etmene yardımcı olacaktır.
  • Son olarak, diagnosis adlı bir vektörü, tanı malign ise ("M") 1, değilse 0 olacak şekilde ayarla. R'nin TRUE'yu 1'e, FALSE'u 0'a dönüştürdüğünü unutma.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

url <- "https://assets.datacamp.com/production/course_1903/datasets/WisconsinCancer.csv"

# Download the data: wisc.df


# Convert the features of the data: wisc.data


# Set the row names of wisc.data
row.names(wisc.data) <- wisc.df$___

# Create diagnosis vector
diagnosis <- as.numeric(wisc.df$diagnosis == ___)
Kodu Düzenle ve Çalıştır