html_table() ile bir tabloyu veri çerçevesine dönüştür
Bir tabloda bir başlık satırı (th öğeleriyle) varsa ve boşluk yoksa, onu kazımak aşağıdaki tabloda olduğu gibi oldukça kolaydır (ID'si "clean" olan):
| Mountain | Height | First ascent | Country |
|---|---|---|---|
| Mount Everest | 8848 | 1953 | Nepal, China |
| ... |
Aynı tablonun (ID'si "dirty" olan) ayrılmış bir başlık satırı olmadan ve ilk satırda eksik bir hücreyle olan hâli burada:
| Mountain | Height | First ascent | Country |
| Mount Everest | 8848 | 1953 | |
| ... |
Bu tür durumlar için, videoda gösterildiği gibi, tabloyu doğru biçimde ayrıştırmak üzere kullanabileceğin html_table() fonksiyonunun ekstra bir argümanı vardır. Eksik hücreler otomatik olarak tanınır ve NA değerleriyle değiştirilir.
Her iki tablo da mountains_html belgesinin içindedir.
Bu egzersiz
R ile Web Kazıma
kursunun bir parçasıdırUygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Extract the "clean" table into a data frame
mountains <- mountains_html %>%
html_element("table#clean") %>%
___
mountains