Mantenlo descriptivo
Para comprender mejor las experiencias de los viajeros en el aeropuerto de San Francisco, el departamento de control de calidad envió un cuestionario cualitativo a todos los viajeros que dieron al aeropuerto la peor puntuación en todas las categorías posibles. El objetivo de este cuestionario es identificar patrones comunes en lo que dicen los viajeros sobre el aeropuerto.
Su respuesta se almacena en la columna survey_response
. Al observar más en detalle, te diste cuenta de que algunas de las respuestas daban la menor cantidad posible de caracteres sin mucha sustancia. En este ejercicio, aislarás las respuestas con un número de caracteres superior a 40 y te asegurarás de que tu nuevo DataFrame contiene respuestas con 40 caracteres o más utilizando una instrucción assert
.
El DataFrame airlines
está en tu entorno, y pandas
se importa como pd
.
Este ejercicio forma parte del curso
Limpieza de datos en Python
Instrucciones de ejercicio
- Utilizando el DataFrame
airlines
, almacena la longitud de cada instancia de la columnasurvey_response
enresp_length
utilizando.str.len()
. - Aísla las filas de
airlines
conresp_length
superior a40
. - Afirma que la menor longitud de
survey_response
enairlines_survey
es ahora mayor que40
.
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# Store length of each row in survey_response column
resp_length = ____
# Find rows in airlines where resp_length > 40
airlines_survey = airlines[____ > ____]
# Assert minimum survey_response length is > 40
assert ____.str.len().____ > _____
# Print new survey_response column
print(airlines_survey['survey_response'])