XPATH'in text() fonksiyonuyla doğrudan ebeveynden seç
Bu egzersizde yine aynı tabloyla çalışacaksın. Bu kez, parantez içindeki işlev bilgisini (function) ayrı bir sütuna çıkaracaksın; yani iki değil, üç sütun içeren bir veri çerçevesi elde etmen gerekiyor: aktörler, roller ve işlevler.
Bunu yapmak için, videoda tanıtılan özel XPATH fonksiyonunu html_table() yerine uygulamalısın. Çünkü HTML table öğesi burada olduğu gibi iyi yapılandırılmamışsa html_table() çoğu zaman pratikte işe yaramaz.
Referans olması için, tablonun HTML'inden bir alıntıyı tekrar veriyoruz:
<table>
<tr>
<th>Actor</th>
<th>Role</th>
</tr>
<tr>
<td class = 'actor'>Jayden Carpenter</td>
<td class = 'role'><em>Mickey Mouse</em> (Voice)</td>
</tr>
...
</table>
Bu egzersizde, roles_html değişkeni table öğesini içeren HTML belgesini barındırır.
Bu egzersiz
R ile Web Kazıma
kursunun bir parçasıdırUygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Extract the actors in the cells having class "actor"
actors <- roles_html %>%
html_elements(xpath = '//table//td[@class = "actor"]') %>%
html_text()
actors
# Extract the roles in the cells having class "role"
roles <- roles_html %>%
html_elements(xpath = '//table//td[@class = "___"]/___') %>%
___()
roles