Fraudeurs vinden op basis van onderwerp
In deze oefening ga je de resultaten van het topicmodel terugkoppelen naar je originele data. Je hebt net geleerd dat je alles wat met topic 3 te maken heeft wilt markeren. Zoals je zult zien, is dat niet helemaal eenvoudig. Je krijgt de functie get_topic_details() die de argumenten ldamodel en corpus gebruikt. Deze haalt de details van de topics op voor elke tekstregel. Met die functie kun je de resultaten weer aan je oorspronkelijke data toevoegen. Wil je meer leren over het werken met modelresultaten (buiten de scope van deze cursus), lees dan zeker dit artikel.
Beschikbaar voor jou zijn de dictionary en corpus, de tekstdata text_clean en je modelresultaten ldamodel. Ook get_topic_details() is gedefinieerd.
Deze oefening maakt deel uit van de cursus
Fraudedetectie in Python
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Run get_topic_details function and check the results
print(get_topic_details(____, ____))