Organizar datos de llamadas transcritas

Ya casi estamos listos para construir un clasificador de texto. Pero ahora mismo, todo nuestro texto transcrito está en dos listas, pre_purchase_text y post_purchase_text.

Para organizarlo mejor de cara a construir un clasificador de texto y también para usos futuros, lo juntaremos en un DataFrame de pandas.

Para empezar, importaremos pandas como pd y luego crearemos un DataFrame de postcompra, post_purchase_df, usando pd.DataFrame().

Pasaremos a pd.DataFrame() un diccionario que contenga una clave "label" con el valor "post_purchase" y una clave "text" con el valor de nuestra lista post_purchase_text.

Haremos lo mismo para pre_purchase_df, pero con pre_purchase_text.

Para tener todos los datos en un solo sitio, usaremos pd.concat() y le pasaremos los DataFrames de pre y postcompra.

Este ejercicio forma parte del curso

Procesamiento del lenguaje hablado en Python

Ver curso

Instrucciones del ejercicio

Crea post_purchase_df usando la lista post_purchase_text.
Crea pre_purchase_df usando la lista pre_purchase_text.
Combina los dos DataFrames usando pd.concat().

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

import pandas as pd

# Make dataframes with the text
post_purchase_df = pd.DataFrame({"label": "post_purchase",
                                 "text": ____})
pre_purchase_df = pd.____({"label": "pre_purchase",
                                "text": ____})

# Combine DataFrames
df = pd.____([post_purchase_df, pre_purchase_df])

# Print the combined DataFrame
print(df.head())

Editar y ejecutar código