1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Čištění dat v R

Connected

cvičení

Odstraňování částečných duplikátů

Teď, když jsi identifikoval/a a odstranil/a úplné duplikáty, je čas zkontrolovat částečné duplikáty. S těmi se pracuje o něco složitěji než s úplnými. V tomto cvičení nejdřív najdeš případné částečné duplikáty a pak si procvičíš nejčastější techniku, jak s nimi naložit – odstraníš všechny částečné duplikáty a ponecháš vždy jen první výskyt.

dplyr je načten a datová sada bike_share_rides je k dispozici.

Pokyny 1/3

undefined XP
    1
    2
    3
  • Spočítej počet výskytů každého ride_id.
  • Vyfiltruj ride_id, která se vyskytují vícekrát.