Da testo a DataFrame
Ora che hai generato queste feature basate sui conteggi in un array, devi riformattarle in modo che possano essere combinate con il resto dell'insieme di dati. Puoi farlo convertendo l'array in un DataFrame pandas, usando come nomi delle colonne i nomi delle feature che hai trovato prima, e poi concatenandolo al DataFrame originale.
Il numpy array (cv_array) e il vectorizer (cv) che hai addestrato nell'esercizio precedente sono disponibili nel tuo workspace.
Questo esercizio fa parte del corso
Feature Engineering per il Machine Learning in Python
Istruzioni dell'esercizio
- Crea un DataFrame
cv_dfcontenentecv_arraycome valori e i nomi delle feature come nomi delle colonne. - Aggiungi il prefisso
Counts_ai nomi delle colonne per facilitarne l'identificazione. - Concatena questo DataFrame (
cv_df) al DataFrame originale (speech_df) per colonne.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Create a DataFrame with these features
cv_df = pd.DataFrame(____,
columns=____).____('Counts_')
# Add the new columns to the original DataFrame
speech_df_new = ____([speech_df, cv_df], axis=1, sort=False)
print(speech_df_new.head())