IniziaInizia gratis

Feature engineering

Ti è stato chiesto di prevedere se un nuovo gruppo di richiedenti prestito rischia o meno di andare in default. Hai a disposizione uno storico e vuoi addestrare su di esso un classificatore. Noti che molte feature sono in formato stringa, il che è un problema per i tuoi classificatori. Decidi quindi di codificare numericamente le colonne di tipo stringa usando LabelEncoder(). La funzione è già stata caricata per te dal sottomodulo preprocessing di sklearn. Anche il dataset credit è pre-caricato, così come l’elenco di tutti i nomi delle colonne con tipo di dato stringa, salvato in non_numeric_columns.

Questo esercizio fa parte del corso

Progettare workflow di Machine Learning in Python

Visualizza il corso

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Inspect the first few lines of your data using head()
credit.____
Modifica ed esegui il codice