ComenzarEmpieza gratis

Ratios

Aunque no es estrictamente una medida de importancia dentro de una red, la idea de ser "ratio'd" es una métrica particular de Twitter que suele usarse para juzgar la impopularidad de un tuit. "The Ratio", como se le llama, se calcula tomando el número de respuestas y dividiéndolo entre el número de retuits. Para nuestros fines, tiene sentido conceptual tomar solo los grados de entrada de las redes de retuits y de respuestas.

Las redes G_rt y G_reply, y column_names = ['screen_name', 'degree'] ya se han cargado por ti.

Este ejercicio forma parte del curso

Análisis de datos de redes sociales con Python

Ver curso

Instrucciones del ejercicio

  • Calcula el grado de entrada para la red de retuits con el método del grafo .in_degree().
  • Haz lo mismo para la red de respuestas.
  • Une los dos DataFrames usando .merge().
  • Calcula la ratio. Los nombres de las columnas son degree_reply y degree_rt.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Calculate in-degrees and store in DataFrame
degree_rt = pd.DataFrame(list(____.____()), columns = column_names)
degree_reply = pd.DataFrame(list(____.____()), columns = column_names)

# Merge the two DataFrames on screen name
ratio = ____.____(____, on = 'screen_name', suffixes = ('_rt', '_reply'))

# Calculate the ratio
ratio['ratio'] = ____ / ____

# Exclude any tweets with less than 5 retweets
ratio = ratio[ratio['degree_rt'] >= 5]

# Print out first five with highest ratio
print(ratio.sort_values('ratio', ascending = False).head())
Editar y ejecutar código