Taksi ücreti tutarının dağılımı
Hadi NYC’de taksi yolculuklarının ne kadara mal olduğunu öğrenelim ve toplam taksi ücretinin histogramına bakalım. Ücret tutarının oldukça çarpık olma olasılığı yüksek olduğundan, x eksenini log ölçeğinde çizdireceğiz.
tx veri kümesi senin için önceden yüklendi.
Bu egzersiz
R ile Trelliscope kullanarak Büyük Veriyi Görselleştirme
kursunun bir parçasıdırEgzersiz talimatları
geom_histogram()kullanarak toplam taksi ücretinin,total_amountdeğişkeninin dağılımını çiz.- Son satırda,
scale_x_log10()kullanarak x eksenine 10 tabanında log ölçeği uygula. Toplam ücretin $0 olduğu 62 veri noktası hakkında bir uyarı mesajı alacağını unutma. Logaritma sonsuz olduğu için bu noktalar yok sayılır.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
library(ggplot2)
# Create a histogram of total_amount
ggplot(___, aes(___)) +
___ +
___