Codifica delle variabili categoriche - binaria
Dai un'occhiata all'insieme di dati hiking. Ci sono diverse colonne che vanno codificate prima di poterle usare in un modello; tra queste c'è la colonna Accessible. Accessible è una caratteristica binaria, quindi ha due valori, Y o N, che devono essere convertiti in 1 e 0. Usa il metodo LabelEncoder di scikit-learn per effettuare questa trasformazione.
Questo esercizio fa parte del corso
Preprocessing per il Machine Learning in Python
Istruzioni dell'esercizio
- Memorizza
LabelEncoder()in una variabile chiamataenc. - Usando il metodo
.fit_transform()dell'encoder, codifica la colonna"Accessible"dell'insieme di datihiking. Chiama la nuova colonnaAccessible_enc. - Confronta le due colonne affiancate per vedere la codifica.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Set up the LabelEncoder object
enc = ____
# Apply the encoding to the "Accessible" column
____ = ____.____(____)
# Compare the two columns
print(____[[____, ____]].head())