1. Nauka
  2. /
  3. Kursy
  4. /
  5. Funkcyjne programowanie średnio zaawansowane z purrr

Connected

ćwiczenie

Tworzenie ramki danych z kolumną listową

Zakończmy ten rozdział implementacją naszego ekstraktora linków – tym razem z użyciem kolumny listowej. Główna idea zagnieżdżonej ramki danych (czyli ramki danych z kolumną listową) polega na tym, żeby przechowywać wszystko w jednej ramce danych i utrzymać porządek w całym przepływie pracy.

Masz do dyspozycji tibble o nazwie df, który zawiera kolumnę urls z czterema adresami URL używanymi od początku tego rozdziału. Jeśli chcesz przejrzeć tę ramkę danych, możesz ją wypisać w konsoli.

Utworzysz nową kolumnę o nazwie links, która będzie zawierać wyniki funkcji get_links() (dostępnej w twoim środowisku pracy). Ponieważ wyniki tej funkcji mają różne długości, kolumna wyjściowa będzie kolumną listową – następnie użyjesz unnest(), aby przekształcić ją z powrotem w standardową ramkę danych.

Instrukcje

100 XP
  • Wczytaj trzy niezbędne pakiety: dplyr, tidyr i purrr.

  • Weź element df i wywołaj na nim mutate(). Wewnątrz mutate() zmapuj funkcję get_links() na kolumnę urls.

  • Wypisz wynik.

  • Wykonaj unnest() na wyniku.