Rechercher l’homophilie dans un réseau
Les nœuds disposent souvent de caractéristiques ou d’attributs qui leur sont associés. Le data frame account_info contient le type de chaque compte. L’homophilie est un concept issu de la sociologie. Dans un réseau de fraude, l’homophilie signifie que les fraudeurs sont plus susceptibles d’être connectés à d’autres fraudeurs, et que les personnes légitimes sont plus susceptibles d’être connectées à d’autres personnes légitimes. Selon le contexte métier et le type de fraude, l’homophilie peut être présente ou non. Vérifions la présence d’homophilie dans le réseau à partir de l’attribut account_type.
Vous pouvez ajouter des attributs aux nœuds de votre réseau avec V(my_network)$new_node_attribute.
Le package igraph et le réseau net de l’exercice précédent sont chargés dans votre environnement de travail.
Cet exercice fait partie du cours
Détection de fraude en R
Instructions
- Ajoutez la variable
typedeaccount_infocomme attributaccount_typeaux nœuds du réseaunet. - Affichez les attributs des sommets de
net. - Comme
account_typeest une variable nominale, vérifiez l’homophilie dans le réseau en fonction deaccount_typeen utilisantassortativity_nominal.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Add account_type as an attribute to the nodes of the network
___(net)$___ <- ___$___
# Have a look at the vertex attributes
print(___(___))
# Check for homophily based on account_type
___(___, types = ___, directed = FALSE)