Nihai veri kümesini kontrol et
Bu noktada özgün abalone veri kümesine altı yeni değişken ekledin ve sütun sayısını 9'dan 15'e çıkardın. Ayrıca çeşitli ölçüm ya da veri kayıt hataları içeren (2+4+2) = 8 vakayı eleyerek 4169 vaka bıraktın.
Bu egzersizde dim() çalıştırarak nihai abaloneKeep veri kümesinin boyutlarını kontrol ederek bu sayıları doğrulayacaksın. Ayrıca bu nihai veri kümesi üzerinde bazı kontroller yapacak, tüm değişkenler için özet istatistikleri inceleyecek ve ağırlıklar ile boyutlar hakkındaki varsayımları iki kez kontrol etmek için birkaç saçılım grafiği daha oluşturacaksın.
abaloneKeep veri kümesi ile dplyr ve ggplot2 paketleri senin için yüklendi.
Bu egzersiz
SAS Kullananlar İçin R
kursunun bir parçasıdırEgzersiz talimatları
- Nihai
abaloneKeepveri kümesinin boyutlarını al. abaloneKeepiçindeki tüm değişkenlerin özet istatistiklerini al.- x ekseninde
wholeWeight, y eksenindeshuckedWeightolacak şekilde bir saçılım grafiği çiz; kesişim 0 ve eğim 1 olan bir referans çizgisi ekle. - x ekseninde
diameter, y eksenindelengtholacak şekilde bir saçılım grafiği çiz; kesişim 0 ve eğim 1 olan bir referans çizgisi ekle.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Dimensions of final dataset with samples in abaloneKeep
___
# Get summary statistics of all variables in abaloneKeep
___
# Scatterplot of shuckedWeight by wholeWeight add y=x line
ggplot(___) +
___ +
___
# Scatterplot of length by diameter add y=x line
ggplot(___) +
___ +
___