Cosa rende un prodotto importante?
Ora che abbiamo definito in modo operativo cosa sia un prodotto importante, vediamo se esistono proprietà che potrebbero essere correlate. Una coppia candidata è salesrank.from e salesrank.to. Possiamo chiederci se i prodotti importanti tendono ad avere posizioni in classifica (sales rank) più alte rispetto ai prodotti acquistati a valle. Lo verificheremo selezionando prima i vertici importanti, unendoli al dataframe iniziale e poi creando un nuovo dataframe usando il pacchetto dplyr. Creeremo un nuovo grafo e coloreremo gli archi in blu per passaggi da rank alto (1, 2, 3) a rank basso (20, 21, 22) e in rosso per il caso opposto. Se il rank è correlato agli acquisti a valle, vedremo soprattutto collegamenti blu; se non c’è relazione, i collegamenti saranno più o meno equamente blu e rossi.
Il dataset ip_df contiene le informazioni sui prodotti importanti.
Questo esercizio fa parte del corso
Casi di studio: analisi di reti in R
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Select the from and to columns from ip_df
ip_df_from_to <- ip_df[c(___,___)]
# Create a directed graph from the data frame
ip_g <- graph_from_data_frame(___, directed = ___)
# Set the edge color. If salesrank.from is less than or
# equal to salesrank.to then blue else red.
edge_color <- ifelse(
ip_df$___ <= ip_df$___,
yes = ___,
no = ___
)