Inspecciona valores Tf-idf
Después de crear características Tf-idf, a menudo querrás entender cuáles son las palabras con mayor puntuación para cada corpus. Esto se puede lograr aislando la fila que quieres examinar y ordenando las puntuaciones de mayor a menor.
El DataFrame del último ejercicio (tv_df) está disponible en tu espacio de trabajo.
Este ejercicio forma parte del curso
Ingeniería de características para Machine Learning en Python
Instrucciones del ejercicio
- Asigna la primera fila de
tv_dfasample_row. sample_rowes ahora una serie de pesos asignados a palabras. Ordena estos valores para imprimir las 5 palabras mejor puntuadas.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Isolate the row to be examined
sample_row = tv_df.____
# Print the top 5 words of the sorted output
print(sample_row.____(ascending=____).____())