MulaiMulai sekarang secara gratis

Rasio

Meskipun bukan ukuran kepentingan jaringan secara ketat, konsep menjadi "ratio'd" adalah ukuran jaringan yang khas di Twitter dan biasanya digunakan untuk menilai ketidakpopuleran sebuah tweet. "The Ratio" dihitung dengan mengambil jumlah balasan lalu membaginya dengan jumlah retweet. Untuk tujuan kita, secara konseptual masuk akal untuk hanya mengambil in-degree dari kedua jaringan retweet dan balasan.

Jaringan G_rt dan G_reply, serta column_names = ['screen_name', 'degree'] telah dimuat untuk Anda.

Latihan ini adalah bagian dari kursus

Menganalisis Data Media Sosial dengan Python

Lihat Kursus

Petunjuk latihan

  • Hitung in-degree untuk jaringan retweet dengan metode graf .in_degree().
  • Lakukan hal yang sama untuk jaringan balasan.
  • Gabungkan kedua DataFrame menggunakan .merge().
  • Hitung rasionya. Nama kolomnya adalah degree_reply dan degree_rt.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Calculate in-degrees and store in DataFrame
degree_rt = pd.DataFrame(list(____.____()), columns = column_names)
degree_reply = pd.DataFrame(list(____.____()), columns = column_names)

# Merge the two DataFrames on screen name
ratio = ____.____(____, on = 'screen_name', suffixes = ('_rt', '_reply'))

# Calculate the ratio
ratio['ratio'] = ____ / ____

# Exclude any tweets with less than 5 retweets
ratio = ratio[ratio['degree_rt'] >= 5]

# Print out first five with highest ratio
print(ratio.sort_values('ratio', ascending = False).head())
Edit dan Jalankan Kode