Kısmi kopyaları birleştirerek özetleme
Kısmi kopyaları ele almanın bir başka yolu, aralarında farklılık olan değerlerin bir özet istatistiğini (örneğin ortalama, medyan, maksimum veya minimum) hesaplamaktır. Bu, verinin nasıl toplandığından emin olmadığında ve ortalama bir değer istediğinde ya da alan bilgisini kullanarak, olduğundan yüksek bir tahminin düşük bir tahminden (ya da tam tersi) daha iyi olduğunu düşündüğünde işine yarar.
dplyr yüklü ve bike_share_rides kullanılabilir.
Bu egzersiz
R ile Veri Temizleme
kursunun bir parçasıdırEgzersiz talimatları
bike_share_ridesverisiniride_idvedateile grupla.- Satırın
ride_idvedatedeğerleri için ortalama sürüş süresini içerenduration_min_avgadlı bir sütun ekle. ride_idvedatetemelinde kopyaları kaldır ve veri çerçevesindeki tüm sütunları koru.duration_minsütununu kaldır.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
bike_share_rides %>%
# Group by ride_id and date
___ %>%
# Add duration_min_avg column
mutate(duration_min_avg = ___ ) %>%
# Remove duplicates based on ride_id and date, keep all cols
___ %>%
# Remove duration_min column
___(-___)