1. Learn
  2. /
  3. Courses
  4. /
  5. Funkcyjne programowanie średnio zaawansowane z purrr

Connected

Exercise

Zabawa z tweetami – runda 1

Pamiętasz, że w poprzednich rozdziałach kursu pracowałeś(-aś) jako analityk danych w agencji internetowej? Świetnie sobie radziłeś(-aś), więc teraz czeka na ciebie kolejny projekt ;) W tym rozdziale przeanalizujesz nowy rodzaj danych: dane w formacie JSON.

Zespół inżynierski przekazał ci wyniki zbierania danych zawierające tweety opublikowane podczas konferencji RStudio Conf 2018. Ponieważ zbiór danych jest w formacie JSON, wczytałeś(-aś) go do R jako zagnieżdżoną listę.

Na początek chcesz przeprowadzić podstawową eksplorację tego zbioru danych – z pomocą przyjdzie pakiet purrr. Pakiet jest już załadowany, a zbiór danych rstudioconf jest dostępny w twoim środowisku pracy.

Uwaga: nie próbuj wyświetlać całego zbioru danych – jest zbyt duży, by wyświetlić go w konsoli DataCamp.

Pamiętaj, że to prawdziwe dane z Twittera, dlatego mogą zawierać wulgaryzmy lub inne nieodpowiednie treści (dotyczy to tego ćwiczenia i kolejnych ćwiczeń korzystających z rzeczywistych danych z Twittera).

Instructions

100 XP
  • Wyświetl pierwszy element listy, aby zapoznać się z jej zawartością i strukturą.

  • Ponieważ interesują cię wyłącznie oryginalne tweety (nie retwity), utwórz podlistę zawierającą tweety niebędące retweetami – wykorzystaj element logiczny "is_retweet" zawarty w każdej podliście.

  • Wyodrębnij element "favorite_count" z każdego elementu nowej podlisty, używając wariantu map_* przeznaczonego dla liczb całkowitych.

  • Oblicz medianę uzyskanego wyniku.