1. Learn
  2. /
  3. कोर्स
  4. /
  5. Web Scraping w R

Connected

अभ्यास

Parsowanie hiperłączy do ramki danych

Przyjrzyj się poniższej liście ul z "przydatnymi linkami".

Składa się z trzech elementów li, które zawierają elementy a z odnośnikami:


Helpful links

  • Wikipedia
  • Dictionary
  • Search Engine

Compiled with help from Google.


Odpowiadający temu kod HTML jest dostępny jako ciąg znaków w zmiennej hyperlink_raw_html.

W tym ćwiczeniu sparsujemy te linki do ramki danych R, wybierając wyłącznie elementy a znajdujące się wewnątrz elementów li.

PS: Do tego celu użyjesz funkcji tibble() z biblioteki Tidyverse. tibble() to uproszczona wersja data.frame(), którą na pewno już znasz. Podobnie jak w data.frame(), podajesz nazwy kolumn i dane jako pary nazwa–wartość:

my_tibble <- tibble(
  column_name_1 = value_1,
  column_name_2 = value_2,
  ...
)

निर्देश 1/2

undefined XP
    1
    2
  • Wyodrębnij wszystkie węzły a znajdujące się wewnątrz listy punktowanej, używając funkcji html_elements().