1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Čištění dat v R

Connected

cvičení

Neplatný člen

Teď, když už umíš identifikovat problémy s porušením omezení členství, je čas je opravit na novém datasetu. V celé této kapitole budeš pracovat s datasetem sfo_survey, který obsahuje odpovědi cestujících z Mezinárodního letiště San Francisco (SFO). Účastníci odpovídali na otázky týkající se čistoty letiště, čekacích dob, bezpečnosti a celkové spokojenosti.

Během sběru dat došlo k několika problémům, které způsobily určité nekonzistence v datasetu. V tomto cvičení budeš pracovat se sloupcem dest_size, který kategorizuje velikost cílového letiště, na které cestující letěli. K dispozici máš datový rámec dest_sizes obsahující všechny platné velikosti destinací. Tvým úkolem je najít řádky s neplatnými hodnotami dest_size a odstranit je z datového rámce.

dplyr je načtený a sfo_survey i dest_sizes jsou dostupné.

Pokyny 1/4

undefined XP
    1
    2
    3
    4
  • Spočítej počet výskytů každé hodnoty dest_size v sfo_survey.