BaşlayınÜcretsiz Başlayın

Kısmi kopyaları birleştirerek özetleme

Kısmi kopyaları ele almanın bir başka yolu, aralarında farklılık olan değerlerin bir özet istatistiğini (örneğin ortalama, medyan, maksimum veya minimum) hesaplamaktır. Bu, verinin nasıl toplandığından emin olmadığında ve ortalama bir değer istediğinde ya da alan bilgisini kullanarak, olduğundan yüksek bir tahminin düşük bir tahminden (ya da tam tersi) daha iyi olduğunu düşündüğünde işine yarar.

dplyr yüklü ve bike_share_rides kullanılabilir.

Bu egzersiz

R ile Veri Temizleme

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • bike_share_rides verisini ride_id ve date ile grupla.
  • Satırın ride_id ve date değerleri için ortalama sürüş süresini içeren duration_min_avg adlı bir sütun ekle.
  • ride_id ve date temelinde kopyaları kaldır ve veri çerçevesindeki tüm sütunları koru.
  • duration_min sütununu kaldır.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

bike_share_rides %>%
  # Group by ride_id and date
  ___ %>%
  # Add duration_min_avg column
  mutate(duration_min_avg = ___ ) %>%
  # Remove duplicates based on ride_id and date, keep all cols
  ___ %>%
  # Remove duration_min column
  ___(-___)
Kodu Düzenle ve Çalıştır