Variabili correlate
In questo esercizio esaminerai l’insieme di dati rispetto alle variabili correlate. È importante rimuoverle prima di applicare un classificatore binario, soprattutto nel caso della regressione logistica. Quando due o più variabili sono fortemente correlate, dovresti eliminarle tutte tranne una.
Per iniziare, useremo la funzione corrplot() del pacchetto corrplot per visualizzare le correlazioni.
Nel grafico delle correlazioni, il blu rappresenta una correlazione positiva e il rosso una negativa.
Un colore più scuro indica una correlazione più alta.
Infine, rimuoverai le variabili fortemente correlate dall’insieme di dati.
Questo esercizio fa parte del corso
Analitica predittiva con dati di rete in R
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Remove the Future column from studentnetworkdata
no_future <- ___
# Load the corrplot package
library(___)
# Generate the correlation matrix
M <- ___(no_future)
# Plot the correlations
___(M, method = "circle")