1. Nauka
  2. /
  3. Projekty
  4. /
  5. Studium przypadku: eksploracyjna analiza danych w R

Connected

ćwiczenie

Porządkowanie zbioru danych za pomocą gather

Aby przedstawić połączone dane głosowań i tematów w uporządkowanej formie, która umożliwi analizę i wizualizację według tematu, trzeba przekształcić dane tak, żeby każdy wiersz zawierał jedną kombinację: kraj–głos–temat. Zmieni to strukturę danych z sześciu kolumn (me, nu, di, hr, co, ec) na dwie kolumny: topic i has_topic.

Instrukcje

100 XP
  • Wczytaj pakiet tidyr.
  • Zbierz sześć kolumn tematycznych z votes_joined do jednej kolumny o nazwie topic (zawierającej wartości takie jak me, nu itp.) i kolumny has_topic (zawierającej 0 lub 1). Wyświetl wynik bez zapisywania go.
  • Wiersze, w których has_topic wynosi 0, nie są potrzebne. Wykonaj operację gather() ponownie, ale tym razem odfiltruj tylko te wiersze, w których temat w kolumnie topic opisuje dane głosowanie. Zapisz wynik jako votes_gathered.