Değişkenleri inceleme
abaloneMod içine birkaç yeni değişken eklediğimize göre, sonraki egzersizler özet istatistikler ve grafiksel görselleştirme kullanarak verinin kalitesini inceleyecek.
Ayrıca dplyr::filter() fonksiyonunu kullanarak hatalı ya da mantıksız değerlere sahip vakaları (abaloneMod veri kümesindeki satırlar) filter() ile ayıklayacaksın. Örneğin, birkaç abalonenin height değeri 0 mm görünüyor; bu muhtemelen yazım ya da ölçüm hatasından kaynaklanan yanlış bir değer.
abaloneMod veri kümesi, dplyr ve ggplot2 paketleriyle birlikte senin için yüklendi. Vakaları filtreledikten sonra, gelecekteki derslerde analiz için kullanılacak nihai vakaları içeren abaloneKeep adlı yeni, değiştirilmiş bir veri kümesi kopyası oluşturacaksın.
Bu egzersiz
SAS Kullananlar İçin R
kursunun bir parçasıdırEgzersiz talimatları
- Abalone yükseklikleri için özet istatistikleri al.
- Yüksekliği 0'dan büyük olan vakaları tut ve bu vakaları yeni
abaloneKeepveri çerçevesine ata. abaloneKeepiçinde tutulan abalones için, artık hepsi 0'dan büyük olmalı, yüksekliklerin bir histogramını oluştur.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Pull height from abaloneMod and run summary()
___ %>%
___ %>%
___
# Keep cases with height > 0 assign to abaloneKeep
___ <- ___ %>%
___
# Make histogram of updated heights in abaloneKeep
ggplot(___) +
___