1. Nauka
  2. /
  3. Kursy
  4. /
  5. Wizualizacja danych geoprzestrzennych w R

Connected

ćwiczenie

Sprawdzanie zgodności danych

Wymuszenie wstawienia danych bezpośrednio do slotu data nie zadziała, ponieważ traci się poprawne przyporządkowanie między wierszami a obiektami przestrzennymi. Jak zatem dodać dane dochodowe do danych poligonów? Funkcja merge() z pakietu sp powstała dokładnie w tym celu.

Możliwe, że znasz już merge() w kontekście ramek danych. Funkcja sp::merge() działa niemal tak samo, ale przyjmuje obiekt Spatial*** i ramkę danych, a zwraca nowy obiekt Spatial***, którego slot data jest wynikiem połączenia oryginalnego slotu data z tą ramką danych. Do wykonania tego połączenia oba obiekty — przestrzenny i ramka danych — muszą mieć kolumnę zawierającą identyfikatory, według których nastąpi dopasowanie.

Zarówno nyc_tracts, jak i nyc_income mają kolumny z identyfikatorami obszarów spisowych (tract IDs), więc są doskonałymi kandydatami do scalenia tych dwóch zbiorów danych. Zawsze warto jednak sprawdzić, czy proponowane identyfikatory są unikalne i czy dla każdego wiersza w obu zbiorach danych istnieje dopasowanie.

Sprawdźmy to przed przejściem do scalania.

Instrukcje

100 XP
  • Użyj any() z duplicated() na nyc_income$tract, aby sprawdzić, czy każdy wiersz w nyc_income ma unikalny identyfikator obszaru spisowego.
  • Użyj any() z duplicated() na nyc_tracts$TRACTCE, aby sprawdzić, czy każdy wiersz w nyc_tracts ma unikalny identyfikator obszaru spisowego.
  • Użyj all() na nyc_tracts$TRACTCE %in% nyc_income$tract, aby sprawdzić, czy wszystkie obszary spisowe z nyc_tracts znajdują się w nyc_income.
  • Użyj all() na nyc_income$tract %in% nyc_tracts$TRACTCE, aby sprawdzić, czy wszystkie obszary spisowe z nyc_income znajdują się w nyc_tracts.