O que torna um produto importante?
Agora que definimos uma noção prática de produto importante, vamos ver se eles têm propriedades que podem estar correlacionadas. Uma possível dupla é salesrank.from e salesrank.to. Podemos perguntar se produtos importantes tendem a ter classificações de vendas mais altas do que os produtos comprados posteriormente. Vamos investigar isso primeiro filtrando os vértices importantes, juntando-os de volta ao dataframe inicial e, em seguida, criando um novo dataframe usando o pacote dplyr. Vamos criar um novo grafo e colorir as arestas de azul para classificação alta (1, 2, 3) até baixa (20, 21, 22) e de vermelho para o contrário. Se a classificação estiver correlacionada com as compras a jusante, veremos principalmente conexões azuis; se não houver relação, veremos vermelho e azul em proporções semelhantes.
O conjunto de dados ip_df contém as informações sobre os produtos importantes.
Este exercício faz parte do curso
Estudos de caso: Análise de redes em R
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Select the from and to columns from ip_df
ip_df_from_to <- ip_df[c(___,___)]
# Create a directed graph from the data frame
ip_g <- graph_from_data_frame(___, directed = ___)
# Set the edge color. If salesrank.from is less than or
# equal to salesrank.to then blue else red.
edge_color <- ifelse(
ip_df$___ <= ip_df$___,
yes = ___,
no = ___
)