Pilih beberapa tipe HTML
Seperti yang Anda lihat di video, CSS dapat digunakan untuk menata tampilan halaman web. Dalam bentuk paling dasar, ini dilakukan melalui selektor tipe, di mana gaya ditetapkan untuk dan diterapkan pada semua elemen HTML dari tipe tertentu. Sebaliknya, Anda juga dapat menggunakan selektor tipe untuk melakukan scraping halaman guna mengambil elemen HTML tertentu.
Seperti yang ditunjukkan di video, Anda juga dapat menggabungkan beberapa selektor tipe dengan koma, yaitu dengan html_elements("type1, type2"). Ini akan memilih semua elemen yang memiliki type1 atau type2.
Perhatikan HTML berikut:
<html>
<body>
<div>Python is perfect for programming.</div>
<p>Still, R might be better suited for data analysis.</p>
<small>(And has prettier charts, too.)</small>
</body>
</html>
Kode HTML mentah disediakan untuk Anda dalam variabel languages_raw_html.
Latihan ini adalah bagian dari kursus
Web Scraping di R
Petunjuk latihan
- Baca
languages_raw_html. - Dengan metode yang ditunjukkan di atas, pilih semua elemen
divdanpdalam HTML ini.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Read in the HTML
languages_html <- ___
# Select the div and p tags and print their text
languages_html %>%
___ %>%
html_text()