CommencerCommencer gratuitement

Horodatages suspects

Un intervalle de confiance (IC) pour l’heure d’une transaction peut révéler un horodatage suspect. En estimant les paramètres mu et kappa de la distribution de von Mises à partir d’horodatages précédents, vous pouvez calculer la densité (ou vraisemblance) d’un nouvel horodatage.

Le jeu de données ts contenant tous les horodatages et le package circular sont déjà chargés. Les estimates des 24 premiers horodatages sont disponibles dans votre espace de travail, ainsi que le niveau de probabilité alpha fixé à 95 %.

Cet exercice fait partie du cours

Détection de fraude en R

Afficher le cours

Instructions

  • Récupérez la moyenne périodique (mu) et la concentration (kappa) des 24 premières estimations.
  • Utilisez dvonmises() pour estimer les densités de tous les horodatages dans ts.
  • Utilisez dvonmises() et qvonmises() pour déterminer la valeur seuil à 95 % pour (1 - alpha)/2). Reportez-vous au diaporama si nécessaire !
  • Définissez la variable time_feature : elle doit être vraie si les densités sont supérieures ou égales au seuil, et fausse sinon. Soumettre la réponse pour voir quels horodatages se situent en dehors de l’intervalle de confiance à 95 %.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Estimate the periodic mean and concentration on the first 24 timestamps
p_mean <- ___ %% 24
concentration <- ___

# Estimate densities of all 25 timestamps
densities <- ___(___, mu = ___, kappa = ___)

# Check if the densities are larger than the cutoff of 95%-CI
quantile <- ___((1 - ___)/2, mu = p_mean, kappa = concentration)
cutoff <- ___(___, mu = ___, kappa = ___)

# Define the variable time_feature
time_feature <- ___ >= ___
print(cbind.data.frame(ts, time_feature))
Modifier et exécuter le code