Podział zbioru danych

W poprzednim ćwiczeniu wyznaczono, że średnia liczba retweetów na tweet wynosi 3,3. Teraz przyjrzymy się, ile tweetów przekracza tę średnią, a ile jest poniżej niej.

W tym celu najpierw stworzymy mapper sprawdzający, czy .x jest większe od 3.3. Następnie wypełnimy wstępnie map_at(), gdzie .at to "retweet_count", a .f to najpierw stworzony mapper, a następnie jego negacja.

Uwaga: od czasu powstania tego kursu zachowanie purrr uległo zmianie. Aby uniknąć konfliktu argumentów między .f w partial() a .f w map_at(), należy użyć operatora quasi-cytowania := (czasem nazywanego „operatorem morsa"). Na potrzeby tego ćwiczenia wystarczy wiedzieć, że := działa jak =, ale informuje partial(), że argument powinien zostać przekazany do map_at(), a nie zatrzymany dla siebie.

Gdy narzędzia będą gotowe, użyjemy ich na obiekcie non_rt – wyodrębnieniu „oryginalnych tweetów" ze zbioru danych rstudioconf.

Biblioteka purrr jest już wczytana.

To ćwiczenie jest częścią kursu

Funkcyjne programowanie średnio zaawansowane z purrr

Instrukcje do ćwiczenia

Utwórz mean_above – mapper sprawdzający, czy .x jest większe od 3.3.
Przygotuj dwie wersje map_at(): jedną z "retweet_count" i mean_above, a drugą z "retweet_count" i negacją mean_above.
Zastosuj obie wstępnie wypełnione funkcje na obiekcie non_rt i zachowaj tylko elementy "retweet_count".
Sprawdź rozmiar obu wyników.

Interaktywne ćwiczenie praktyczne

Spróbuj tego ćwiczenia, uzupełniając ten przykładowy kod.

# Create mean_above, a mapper that tests if .x is over 3.3
mean_above <- ___(~ ___)

# Prefil map_at() with "retweet_count", mean_above for above, 
# and mean_above negation for below
above <- partial(___, .at = "retweet_count", .f := ___ )
below <- partial(___, .at = "retweet_count", .f := ___ )

# Map above() and below() on non_rt, keep the "retweet_count"
ab <- ___(non_rt, ___) %>% ___("retweet_count")
bl <- ___(non_rt, ___) %>% ___("retweet_count")

# Compare the size of both elements
___(ab)
___(bl)

Edytuj i uruchom kod

To ćwiczenie jest częścią kursu

Funkcyjne programowanie średnio zaawansowane z purrr

SkillTag.level.intermediateSkillTag.label

4.8+

Rozpocznij kurs za darmo

Czy funkcje lambda, mappery i predykaty brzmią dla ciebie groźnie? Nie ma się czego bać! Po odświeżeniu wiedzy o purrr zagłębimy się w podstawy programowania funkcyjnego, poznamy anonimowe funkcje i predykaty, a następnie zobaczymy, jak można je wykorzystać do czyszczenia i eksploracji danych.

Exercise 1: purrr – krótkie przypomnienie Exercise 2: Odświeżenie pamięci o purrr Exercise 3: Jeszcze jedno przypomnienie purrr Exercise 4: Wprowadzenie do maperów Exercise 5: Tworzenie funkcji lambda Exercise 6: Funkcje lambda Exercise 7: Używanie maperów do czyszczenia danych Exercise 8: Porządkowanie danych z użyciem keep Exercise 9: Podział z keep() i discard()Exercise 10: Predykaty Exercise 11: Czym jest predykat?Exercise 12: Eksploracja danych z użyciem predykatów

Gotowy na głębsze poznanie programowania funkcyjnego i purrr? W tym rozdziale odkryjemy koncepcję programowania funkcyjnego, przyjrzymy się obsłudze błędów za pomocą `safely()` i `possibly()`, a także poznamy funkcję `compact()`, która pomoże ci pisać czystszy kod.

Exercise 1: Programowanie funkcyjne w R Exercise 2: Wszystko, co się dzieje, jest wywołaniem funkcji Exercise 3: Rozpoznawanie czystych funkcji Exercise 4: Narzędzia programowania funkcyjnego w purrr Exercise 5: Bezpieczne iteracje Exercise 6: Utwórz funkcję Exercise 7: Zastosowanie possibly()Exercise 8: Wersja read_lines() z possibly()Exercise 9: Wszystko w jednym wywołaniu Exercise 10: Obsługa wyników adverbów Exercise 11: Dopieszczamy naszą funkcję Exercise 12: Pobieranie kodów statusu za pomocą GET()

W tym rozdziale użyjemy purrr, aby pisać kod czytelniejszy, czystszy i łatwiejszy w utrzymaniu. Nauczysz się tworzyć przejrzyste funkcje za pomocą `compose()` i `negate()`. Skorzystamy też z `partial()` do komponowania funkcji przez „wstępne wypełnianie" argumentów istniejących funkcji. Na koniec poznasz kolumny-listy – wygodną strukturę danych, która ułatwia pisanie czystego kodu w stylu Tidyverse.

Exercise 1: Po co dbać o czystość kodu?Exercise 2: Jak pisać compose()Exercise 3: Powrót do pracy Exercise 4: Budowanie funkcji za pomocą compose() i negate()Exercise 5: Zbuduj funkcję Exercise 6: Zlicz wartości NA Exercise 7: Wstępne wypełnianie argumentów funkcji Exercise 8: Ekstraktor treści Exercise 9: Kolejny ekstraktor Exercise 10: Kolumny listowe Exercise 11: Czym są kolumny-listy?Exercise 12: Tworzenie ramki danych z kolumną listową

W tym rozdziale podsumujemy całą wiedzę o purrr w ramach studium przypadku. Użyjemy purrr do analizy danych zescrapowanych z Twittera – z pomocą czystego kodu uporządkujemy dane, a następnie zidentyfikujemy influencerów na Twitterze z konferencji RStudio 2018.

Exercise 1: Odkrywanie zbioru danych Exercise 2: Zabawa z tweetami – runda 1 Exercise 3: Identyfikowanie profili Exercise 4: Wyodrębnianie informacji ze zbioru danych Exercise 5: Zliczanie polubionych tweetów Exercise 6: Wyodrębnianie wzmianek Exercise 7: Manipulowanie adresów URL Exercise 8: Analiza adresów URL Exercise 9: Zabawa z adresami URL Exercise 10: Identyfikowanie influencerów Exercise 11: Podział zbioru danych

Bieżące ćwiczenie

Exercise 12: Mamy zwycięzcę!Exercise 13: Gratulacje!