Taksi ücreti tutarının dağılımı
Hadi NYC’de taksi yolculuklarının ne kadara mal olduğunu öğrenelim ve toplam taksi ücretinin histogramına bakalım. Ücret tutarının oldukça çarpık olma olasılığı yüksek olduğundan, x eksenini log ölçeğinde çizdireceğiz.
tx veri kümesi senin için önceden yüklendi.
Bu egzersiz, kursun bir parçasıdır
R ile Trelliscope kullanarak Büyük Veriyi Görselleştirme
Egzersiz talimatları
geom_histogram()kullanarak toplam taksi ücretinin,total_amountdeğişkeninin dağılımını çiz.- Son satırda,
scale_x_log10()kullanarak x eksenine 10 tabanında log ölçeği uygula. Toplam ücretin $0 olduğu 62 veri noktası hakkında bir uyarı mesajı alacağını unutma. Logaritma sonsuz olduğu için bu noktalar yok sayılır.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
library(ggplot2)
# Create a histogram of total_amount
ggplot(___, aes(___)) +
___ +
___