Bunu httr yoluyla yap
İşte yakın zamanda tatilimi geçirdiğim güzel bir yerin rakımını bulmak için kullandığım bazı rvest kodları.
# HTML belgesini Wikipedia'dan al
wikipedia_page <- read_html('https://en.wikipedia.org/wiki/Varigotti')
# Belgeyi ayrıştır ve içinden rakımı çıkar
wikipedia_page %>%
html_elements('table tr:nth-child(9) > td') %>%
html_text()
Videoda öğrendiğin gibi, read_html() bir URL verildiğinde (bu örnekte olduğu gibi) aslında bir HTTP GET isteği gönderir.
Bu egzersizin amacı, aynı sorguyu read_html() kullanmadan, bunun yerine httr yöntemleriyle tekrar etmektir.
Not: Genelde rvest işini görür, ama bu bölümün ilerleyen kısımlarında göreceğin gibi istekleri özelleştirmek istersen, httr yolunu bilmen gerekir.
Biraz tekrar olsun diye, html_elements() içinde kullanılan CSS seçiciyi bir XPATH sorgusuna da çevireceksin.
Bu egzersiz
R ile Web Kazıma
kursunun bir parçasıdırUygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Get the HTML document from Wikipedia using httr
wikipedia_response <- ___('https://en.wikipedia.org/wiki/Varigotti')
# Parse the response into an HTML doc
wikipedia_page <- ___(___)