IniziaInizia gratis

Da testo a DataFrame

Ora che hai generato queste feature basate sui conteggi in un array, devi riformattarle in modo che possano essere combinate con il resto dell'insieme di dati. Puoi farlo convertendo l'array in un DataFrame pandas, usando come nomi delle colonne i nomi delle feature che hai trovato prima, e poi concatenandolo al DataFrame originale.

Il numpy array (cv_array) e il vectorizer (cv) che hai addestrato nell'esercizio precedente sono disponibili nel tuo workspace.

Questo esercizio fa parte del corso

Feature Engineering per il Machine Learning in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Crea un DataFrame cv_df contenente cv_array come valori e i nomi delle feature come nomi delle colonne.
  • Aggiungi il prefisso Counts_ ai nomi delle colonne per facilitarne l'identificazione.
  • Concatena questo DataFrame (cv_df) al DataFrame originale (speech_df) per colonne.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Create a DataFrame with these features
cv_df = pd.DataFrame(____, 
                     columns=____).____('Counts_')

# Add the new columns to the original DataFrame
speech_df_new = ____([speech_df, cv_df], axis=1, sort=False)
print(speech_df_new.head())
Modifica ed esegui il codice