BaşlayınÜcretsiz Başlayın

XPATH'in text() fonksiyonuyla doğrudan ebeveynden seç

Bu egzersizde yine aynı tabloyla çalışacaksın. Bu kez, parantez içindeki işlev bilgisini (function) ayrı bir sütuna çıkaracaksın; yani iki değil, üç sütun içeren bir veri çerçevesi elde etmen gerekiyor: aktörler, roller ve işlevler.

Bunu yapmak için, videoda tanıtılan özel XPATH fonksiyonunu html_table() yerine uygulamalısın. Çünkü HTML table öğesi burada olduğu gibi iyi yapılandırılmamışsa html_table() çoğu zaman pratikte işe yaramaz.

Referans olması için, tablonun HTML'inden bir alıntıyı tekrar veriyoruz:

<table>
 <tr>
  <th>Actor</th>
  <th>Role</th>
 </tr>
 <tr>
  <td class = 'actor'>Jayden Carpenter</td>
  <td class = 'role'><em>Mickey Mouse</em> (Voice)</td>
 </tr>
 ...
</table>

Bu egzersizde, roles_html değişkeni table öğesini içeren HTML belgesini barındırır.

Bu egzersiz

R ile Web Kazıma

kursunun bir parçasıdır
Kursu Görüntüle

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Extract the actors in the cells having class "actor"
actors <- roles_html %>% 
  html_elements(xpath = '//table//td[@class = "actor"]') %>%
  html_text()
actors

# Extract the roles in the cells having class "role"
roles <- roles_html %>% 
  html_elements(xpath = '//table//td[@class = "___"]/___') %>% 
  ___()
roles
Kodu Düzenle ve Çalıştır