Verdächtige Zeitstempel
Ein Konfidenzintervall (CI) für die Zeit einer Transaktion kann auf einen verdächtigen Zeitstempel hinweisen. Wenn du die Parameter mu und kappa der Von-Mises-Verteilung auf Basis früherer Zeitstempel schätzt, kannst du die Dichte (oder Likelihood) eines neuen Zeitstempels berechnen.
Der Datensatz ts mit allen Zeitstempeln und das Paket circular sind bereits geladen. Die estimates der ersten 24 Zeitstempel stehen in deinem Workspace zur Verfügung, ebenso das Wahrscheinlichkeitsniveau alpha, das auf 95 % gesetzt ist.
Diese Übung ist Teil des Kurses
Fraud Detection in R
Anleitung zur Übung
- Ermittle den periodischen Mittelwert (
mu) und die Konzentration (kappa) der ersten 24 Schätzungen. - Verwende
dvonmises(), um die Dichten aller Zeitstempel intszu schätzen. - Bestimme mit
dvonmises()undqvonmises()den 95-%-Schwellenwert für(1 - alpha)/2). Sieh dir bei Bedarf die Folien an! - Definiere die Variable
time_feature: Sie soll true sein, wenn die Dichten größer oder gleich dem Schwellenwert sind, und andernfalls false. Antwort senden, um zu sehen, welche Zeitstempel außerhalb des 95-%-Konfidenzintervalls liegen.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Estimate the periodic mean and concentration on the first 24 timestamps
p_mean <- ___ %% 24
concentration <- ___
# Estimate densities of all 25 timestamps
densities <- ___(___, mu = ___, kappa = ___)
# Check if the densities are larger than the cutoff of 95%-CI
quantile <- ___((1 - ___)/2, mu = p_mean, kappa = concentration)
cutoff <- ___(___, mu = ___, kappa = ___)
# Define the variable time_feature
time_feature <- ___ >= ___
print(cbind.data.frame(ts, time_feature))