Ekstraktor lainnya

Pada latihan sebelumnya, kita membuat sebuah fungsi yang dapat mengekstrak konten teks dari header H2.

Sekarang kita coba hal lain: kita ingin mengekstrak semua tautan yang ada pada suatu halaman. Untuk melakukannya, kita perlu memanggil dua fungsi httr: html_nodes() dengan argumen css diatur ke "a" (a adalah tag HTML untuk tautan) dan html_attr() yang mengekstrak atribut tertentu dari sebuah node — dalam kasus kita, atribut tersebut adalah "href", yaitu alamat tautan.

purrr dan rvest telah dimuat untuk Anda. Vektor urls juga tersedia di ruang kerja Anda.

Latihan ini merupakan bagian dari kursus

Pemrograman Fungsional Tingkat Menengah dengan purrr

Instruksi latihan

Praisikan html_nodes() dengan argumen css diatur ke "a".
Buat fungsi href(), yang merupakan versi terpraisi dari html_attr().
Komposisikan kombinasi baru dari href(), get_a() dan read_html().
Terapkan fungsi baru ini pada vektor urls.

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

# Create a partial version of html_nodes(), with the css param set to "a"
get_a <- ___(html_nodes, ___)

# Create href(), a partial version of html_attr()
href <- ___(___, name = "href")

# Combine href(), get_a(), and read_html()
get_links <- ___(___, ___, ___)

# Map get_links() to the urls list
res <- ___(urls, ___) %>%
  set_names(urls)

# See the result
res

Edit dan Jalankan Kode

Latihan ini merupakan bagian dari kursus

Pemrograman Fungsional Tingkat Menengah dengan purrr

SkillTag.level.intermediateSkillTag.label

4.8+

Mulai Kursus Gratis

Apakah istilah fungsi lambda, mapper, dan predicate terdengar menakutkan bagi Anda? Tidak perlu khawatir lagi! Setelah menyegarkan kembali ingatan Anda tentang purrr, kita akan menyelami dasar-dasar pemrograman fungsional, mengenal fungsi anonim dan predicate, serta melihat bagaimana kita dapat menggunakannya untuk membersihkan dan mengeksplorasi data.

Exercise 1: Dasar-dasar purrr — kilas balik Exercise 2: Menyegarkan ingatan Anda tentang purrr Exercise 3: Penyegaran purrr lainnya Exercise 4: Pengantar mapper Exercise 5: Membuat fungsi lambda Exercise 6: Fungsi lambda Exercise 7: Menggunakan mapper untuk merapikan data Anda Exercise 8: Rapikan data Anda dengan keep Exercise 9: Pisahkan dengan keep() dan discard()Exercise 10: Predikat Exercise 11: Apa itu predikat?Exercise 12: Mengeksplorasi data dengan predikat

Siap mendalami pemrograman fungsional dan purrr? Di bab ini, kita akan mempelajari konsep pemrograman fungsional, mengeksplorasi penanganan galat termasuk penggunaan safely() dan possibly(), serta mengenalkan fungsi compact() untuk merapikan kode Anda.

Exercise 1: Pemrograman fungsional di R Exercise 2: Segala sesuatu yang terjadi adalah pemanggilan fungsi Exercise 3: Mengidentifikasi fungsi murni Exercise 4: Perangkat untuk pemrograman fungsional di purrr Exercise 5: Iterasi yang aman Exercise 6: Buat sebuah fungsi Exercise 7: Menggunakan possibly()Exercise 8: Versi possibly() dari read_lines()Exercise 9: Semua dalam satu pemanggilan Exercise 10: Menangani hasil adverb Exercise 11: Menyempurnakan fungsi kita Exercise 12: Mengambil kode status dengan GET()

Di bab ini, kita akan menggunakan purrr untuk menulis kode yang lebih jelas, rapi, dan mudah dipelihara. Kita akan mempelajari cara menulis fungsi yang bersih dengan compose() dan negate(). Kita juga akan menggunakan partial() untuk mengomposisikan fungsi dengan “mengisikan terlebih dahulu” argumen dari fungsi yang sudah ada. Terakhir, kita akan mengenalkan list-column, yaitu struktur data yang praktis yang membantu kita menulis kode yang bersih menggunakan Tidyverse.

Exercise 1: Mengapa kode yang lebih bersih?Exercise 2: Cara menulis compose()Exercise 3: Kembali ke kantor Exercise 4: Membangun fungsi dengan compose() dan negate()Exercise 5: Bangun sebuah fungsi Exercise 6: Hitung NA Exercise 7: Mengisikan argumen awal pada fungsi Exercise 8: Ekstraktor konten Exercise 9: Ekstraktor lainnya

Latihan Saat Ini

Exercise 10: Kolom daftar Exercise 11: Tentang list-column Exercise 12: Buat data.frame dengan list-column

Kita akan merangkum semua yang telah kita pelajari tentang purrr dalam sebuah studi kasus. Di sini, kita akan menggunakan purrr untuk menganalisis data yang di-scrape dari Twitter. Kita akan menggunakan kode yang rapi untuk mengorganisasi data, lalu mengidentifikasi influencer Twitter dari konferensi RStudio 2018.

Exercise 1: Menemukan himpunan data Exercise 2: Bermain dengan tweet, putaran 1 Exercise 3: Identifikasi profil Exercise 4: Mengekstrak informasi dari himpunan data Exercise 5: Menghitung favorit Exercise 6: Mengekstrak mention Exercise 7: Memanipulasi URL Exercise 8: Menganalisis URL Exercise 9: Bermain dengan URL Exercise 10: Mengidentifikasi influencer Exercise 11: Membagi himpunan data Exercise 12: Kita punya pemenang!Exercise 13: Selamat!