Visualizzare i pattern nei dati
Il primo passo prima di iniziare a creare un modello è esplorare i dati. Cominciamo esaminando il tuo insieme di dati e visualizzando diversi pattern tra campioni fraudolenti e regolari. In via eccezionale, sarai tu a costruire la visualizzazione!
L'insieme di dati transfers contiene bonifici e alcuni di questi sono stati registrati come frode. La colonna fraud_flag indica se la transazione è fraudolenta (fraud_flag = 1) o no (fraud_flag = 0). Questo insieme di dati e il pacchetto ggplot2 sono già caricati nel tuo ambiente di lavoro.
Questo esercizio fa parte del corso
Rilevamento delle frodi in R
Istruzioni dell'esercizio
- Traccia la colonna
amountcome variabile indipendente sull'asse x e la colonnaorig_balance_before(il saldo sul conto dell'ordinante prima della registrazione del bonifico) come variabile dipendente sull'asse y. - Imposta colore e forma dei dati in base al valore nella colonna
fraud_flag.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Make a scatter plot
ggplot(transfers, aes(x = ___, y = ___)) +
geom_point(aes(color = ___, shape = ___)) +
scale_color_manual(values = c('dodgerblue', 'red'))