Identifier des fraudeurs à partir des sujets
Dans cet exercice, vous allez relier les résultats du modèle de sujets à vos données d’origine. Vous avez désormais identifié qu’il faut marquer tout ce qui est lié au sujet 3. Comme vous le verrez, ce n’est pas si direct. On vous fournit la fonction get_topic_details() qui prend comme arguments ldamodel et corpus. Elle récupère les détails des sujets pour chaque ligne de texte. Grâce à cette fonction, vous pouvez rattacher les résultats à vos données initiales. Si vous souhaitez en savoir plus sur l’exploitation des résultats du modèle — au‑delà du périmètre de ce cours — nous vous recommandons vivement de lire cet article.
Vous avez à disposition dictionary et corpus, les données textuelles text_clean ainsi que les résultats de votre modèle ldamodel. La fonction get_topic_details() est également définie.
Cet exercice fait partie du cours
Détection de fraude en Python
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Run get_topic_details function and check the results
print(get_topic_details(____, ____))