Köprüleri bir veri çerçevesine ayrıştır
Aşağıdaki "faydalı bağlantılar" ul listesine bir göz at.
Üç li öğesinden oluşuyor ve her biri içinde bağlantıları taşıyan a öğeleri var:
Faydalı bağlantılar
Google'ın yardımıyla derlenmiştir.
İlgili HTML kodu, hyperlink_raw_html içinde bir string olarak mevcut.
Bu egzersizde, yalnızca li öğelerinin içindeki a öğelerini seçerek bu bağlantıları bir R veri çerçevesine ayrıştıracaksın.
Not: Bunun için Tidyverse'ten tibble() kullanacaksın. tibble(), muhtemelen zaten bildiğin data.frame()'in daha sade bir sürümüdür. data.frame() gibi, sütun adlarını ve verileri sütun adı-değer çiftleri olarak şöyle belirtirsin:
my_tibble <- tibble(
column_name_1 = value_1,
column_name_2 = value_2,
...
)
Bu egzersiz
R ile Web Kazıma
kursunun bir parçasıdırUygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Extract all the a nodes from the bulleted list
links <- hyperlink_raw_html %>%
read_html() %>%
html_elements('li ___')