¿Qué hace que un producto sea importante?
Ahora que tenemos una definición funcional de lo que es un producto importante, veamos si presentan propiedades correlacionadas. Un par candidato es salesrank.from y salesrank.to. Podemos preguntarnos si los productos importantes tienden a tener mejores posiciones en ventas que los productos que la gente compra a continuación. Lo analizaremos seleccionando primero los vértices importantes, volviendo a unirlos al dataframe inicial y luego creando un nuevo dataframe usando el paquete dplyr. Crearemos un nuevo grafo y colorearemos las aristas en azul cuando el rango sea alto (1, 2, 3) hacia bajo (20, 21, 22) y en rojo para el caso contrario. Si el rango está correlacionado con las compras posteriores, veremos sobre todo enlaces azules; si no hay relación, habrá aproximadamente la misma cantidad de enlaces rojos y azules.
El conjunto de datos ip_df contiene la información sobre los productos importantes.
Este ejercicio forma parte del curso
Estudios de caso: análisis de redes en R
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Select the from and to columns from ip_df
ip_df_from_to <- ip_df[c(___,___)]
# Create a directed graph from the data frame
ip_g <- graph_from_data_frame(___, directed = ___)
# Set the edge color. If salesrank.from is less than or
# equal to salesrank.to then blue else red.
edge_color <- ifelse(
ip_df$___ <= ip_df$___,
yes = ___,
no = ___
)