MulaiMulai sekarang secara gratis

Bermain dengan tweet, putaran 1

Masih ingat bahwa pada bab-bab sebelumnya Anda bekerja sebagai analis data di sebuah agensi web? Kinerja Anda sangat baik dan kini Anda mendapat proyek baru ;) Pada bab ini, Anda akan menganalisis jenis data baru: keluaran JSON.

Tim engineering memberikan keluaran pengumpulan data yang berisi tweet, dikumpulkan selama RStudio Conf 2018. Karena himpunan data ini berupa JSON, Anda membacanya sebagai list bertingkat di R.

Pertama, Anda ingin melakukan eksplorasi dasar terhadap himpunan data ini, dan purrr akan sangat membantu. Paket telah dimuat untuk Anda, dan himpunan data rstudioconf tersedia di workspace Anda.

Catatan: jangan mencoba mencetak seluruh himpunan data — ukurannya terlalu besar untuk ditampilkan di konsol datacamp.

Harap diingat bahwa ini adalah data nyata dari Twitter dan karena itu selalu ada risiko mengandung kata-kata kasar atau konten ofensif lainnya (dalam latihan ini, dan latihan berikutnya yang juga menggunakan data Twitter nyata).

Latihan ini adalah bagian dari kursus

Pemrograman Fungsional Tingkat Menengah dengan purrr

Lihat Kursus

Petunjuk latihan

  • Cetak elemen pertama dari list untuk mendapatkan gambaran umum konten dan strukturnya.

  • Karena Anda ingin berfokus pada tweet yang orisinal (bukan retweet), buat sublist non-retweet menggunakan elemen logis "is_retweet" yang terdapat di setiap sublist.

  • Ekstrak elemen "favorite_count" dari setiap elemen sublist baru ini menggunakan varian map_* untuk bilangan integer.

  • Dapatkan median dari hasil sebelumnya.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Print the first element of the list to the console 


# Create a sublist of non-retweets
non_rt <- ___(___, "is_retweet")

# Extract the favorite count element of each non_rt sublist
fav_count <- ___(___, "favorite_count")

# Get the median of favorite_count for non_rt
___(___)
Edit dan Jalankan Kode