BaşlayınÜcretsiz başlayın

Kısmi kopyaları birleştirerek özetleme

Kısmi kopyaları ele almanın bir başka yolu, aralarında farklılık olan değerlerin bir özet istatistiğini (örneğin ortalama, medyan, maksimum veya minimum) hesaplamaktır. Bu, verinin nasıl toplandığından emin olmadığında ve ortalama bir değer istediğinde ya da alan bilgisini kullanarak, olduğundan yüksek bir tahminin düşük bir tahminden (ya da tam tersi) daha iyi olduğunu düşündüğünde işine yarar.

dplyr yüklü ve bike_share_rides kullanılabilir.

Bu egzersiz, kursun bir parçasıdır

R ile Veri Temizleme

Kursa Göz Atın

Egzersiz talimatları

  • bike_share_rides verisini ride_id ve date ile grupla.
  • Satırın ride_id ve date değerleri için ortalama sürüş süresini içeren duration_min_avg adlı bir sütun ekle.
  • ride_id ve date temelinde kopyaları kaldır ve veri çerçevesindeki tüm sütunları koru.
  • duration_min sütununu kaldır.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

bike_share_rides %>%
  # Group by ride_id and date
  ___ %>%
  # Add duration_min_avg column
  mutate(duration_min_avg = ___ ) %>%
  # Remove duplicates based on ride_id and date, keep all cols
  ___ %>%
  # Remove duration_min column
  ___(-___)
Kodu Düzenle ve Çalıştır