Yolculuk süresi ile toplam ücret arasındaki ilişki
Toplam taksi ücreti ile yolculuğun süresi arasında bir ilişki olacağını varsayabiliriz. Nokta grafiği için veri noktası çok fazla olduğundan, bu ilişkiyi incelemek için altıgen bölmeli bir grafik kullanalım.
tx çalışma alanında senin için hazır.
Bu egzersiz, kursun bir parçasıdır
R ile Trelliscope kullanarak Büyük Veriyi Görselleştirme
Egzersiz talimatları
total_amount(y ekseni) iletrip_duration(x ekseni) arasındaki iki değişkenli dağılımı görselleştirmek için altıgen bölmeler kullan.geom_hex()fonksiyonununbinsargümanını 75 olarak ayarla.- Her iki değişken de oldukça çarpık olduğundan, hem x hem de y eksenlerini log taban 10 olacak şekilde yeniden ölçeklendir. Bu dönüşümlerin, yolculuk süresi veya ücret miktarı sıfır olan nispeten az sayıda kayıt hakkında bazı uyarılar üreteceğini unutma.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
library(ggplot2)
# Create a hexagon-binned plot of total_amount vs. trip_duration
ggplot(tx, aes(___, ___)) +
___ +
___ +
___