1. Nauka
  2. /
  3. Kursy
  4. /
  5. Manipulacja danymi z data.table w R

Connected

ćwiczenie

Aktualizowanie kolumn według grup

Podczas analizy danych często tworzy się pomocnicze kolumny pośrednie, które nie są potrzebne w końcowym wyniku. To bardzo typowy schemat pracy.

W tym ćwiczeniu będziesz pracować z nową data.table o nazwie batrips_new, która jest niemal identyczna z batrips – z tą różnicą, że losowo wprowadzono w niej pewne braki danych w kolumnie duration.

Instrukcje 1/3

undefined XP
    1
    2
    3

Dodaj przez referencję nową kolumnę (mean_dur) zawierającą średni czas trwania wszystkich podróży w podziale na miesiące (na podstawie kolumny start_date). Zwróć uwagę, że kolumna duration zawiera braki danych.