Horodatages suspects
Un intervalle de confiance (IC) pour l’heure d’une transaction peut révéler un horodatage suspect. En estimant les paramètres mu et kappa de la distribution de von Mises à partir d’horodatages précédents, vous pouvez calculer la densité (ou vraisemblance) d’un nouvel horodatage.
Le jeu de données ts contenant tous les horodatages et le package circular sont déjà chargés. Les estimates des 24 premiers horodatages sont disponibles dans votre espace de travail, ainsi que le niveau de probabilité alpha fixé à 95 %.
Cet exercice fait partie du cours
Détection de fraude en R
Instructions
- Récupérez la moyenne périodique (
mu) et la concentration (kappa) des 24 premières estimations. - Utilisez
dvonmises()pour estimer les densités de tous les horodatages dansts. - Utilisez
dvonmises()etqvonmises()pour déterminer la valeur seuil à 95 % pour(1 - alpha)/2). Reportez-vous au diaporama si nécessaire ! - Définissez la variable
time_feature: elle doit être vraie si les densités sont supérieures ou égales au seuil, et fausse sinon. Soumettre la réponse pour voir quels horodatages se situent en dehors de l’intervalle de confiance à 95 %.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Estimate the periodic mean and concentration on the first 24 timestamps
p_mean <- ___ %% 24
concentration <- ___
# Estimate densities of all 25 timestamps
densities <- ___(___, mu = ___, kappa = ___)
# Check if the densities are larger than the cutoff of 95%-CI
quantile <- ___((1 - ___)/2, mu = p_mean, kappa = concentration)
cutoff <- ___(___, mu = ___, kappa = ___)
# Define the variable time_feature
time_feature <- ___ >= ___
print(cbind.data.frame(ts, time_feature))