IniziaInizia gratis

Variabili correlate

In questo esercizio esaminerai l’insieme di dati rispetto alle variabili correlate. È importante rimuoverle prima di applicare un classificatore binario, soprattutto nel caso della regressione logistica. Quando due o più variabili sono fortemente correlate, dovresti eliminarle tutte tranne una.

Per iniziare, useremo la funzione corrplot() del pacchetto corrplot per visualizzare le correlazioni. Nel grafico delle correlazioni, il blu rappresenta una correlazione positiva e il rosso una negativa. Un colore più scuro indica una correlazione più alta. Infine, rimuoverai le variabili fortemente correlate dall’insieme di dati.

Questo esercizio fa parte del corso

Analitica predittiva con dati di rete in R

Visualizza il corso

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Remove the Future column from studentnetworkdata 
no_future <- ___

# Load the corrplot package
library(___)

# Generate the correlation matrix
M <- ___(no_future)

# Plot the correlations
___(M, method = "circle")
Modifica ed esegui il codice