Organizar datos de llamadas transcritas
Ya casi estamos listos para construir un clasificador de texto. Pero ahora mismo, todo nuestro texto transcrito está en dos listas, pre_purchase_text y post_purchase_text.
Para organizarlo mejor de cara a construir un clasificador de texto y también para usos futuros, lo juntaremos en un DataFrame de pandas.
Para empezar, importaremos pandas como pd y luego crearemos un DataFrame de postcompra, post_purchase_df, usando pd.DataFrame().
Pasaremos a pd.DataFrame() un diccionario que contenga una clave "label" con el valor "post_purchase" y una clave "text" con el valor de nuestra lista post_purchase_text.
Haremos lo mismo para pre_purchase_df, pero con pre_purchase_text.
Para tener todos los datos en un solo sitio, usaremos pd.concat() y le pasaremos los DataFrames de pre y postcompra.
Este ejercicio forma parte del curso
Procesamiento del lenguaje hablado en Python
Instrucciones del ejercicio
- Crea
post_purchase_dfusando la listapost_purchase_text. - Crea
pre_purchase_dfusando la listapre_purchase_text. - Combina los dos DataFrames usando
pd.concat().
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
import pandas as pd
# Make dataframes with the text
post_purchase_df = pd.DataFrame({"label": "post_purchase",
"text": ____})
pre_purchase_df = pd.____({"label": "pre_purchase",
"text": ____})
# Combine DataFrames
df = pd.____([post_purchase_df, pre_purchase_df])
# Print the combined DataFrame
print(df.head())