ComenzarEmpieza gratis

Mantenlo descriptivo

Para comprender mejor las experiencias de los viajeros en el aeropuerto de San Francisco, el departamento de control de calidad envió un cuestionario cualitativo a todos los viajeros que dieron al aeropuerto la peor puntuación en todas las categorías posibles. El objetivo de este cuestionario es identificar patrones comunes en lo que dicen los viajeros sobre el aeropuerto.

Su respuesta se almacena en la columna survey_response. Al observar más en detalle, te diste cuenta de que algunas de las respuestas daban la menor cantidad posible de caracteres sin mucha sustancia. En este ejercicio, aislarás las respuestas con un número de caracteres superior a 40 y te asegurarás de que tu nuevo DataFrame contiene respuestas con 40 caracteres o más utilizando una instrucción assert.

El DataFrame airlines está en tu entorno, y pandas se importa como pd.

Este ejercicio forma parte del curso

Limpieza de datos en Python

Ver curso

Instrucciones de ejercicio

  • Utilizando el DataFrame airlines, almacena la longitud de cada instancia de la columna survey_response en resp_length utilizando .str.len().
  • Aísla las filas de airlines con resp_length superior a 40.
  • Afirma que la menor longitud de survey_response en airlines_survey es ahora mayor que 40.

Ejercicio interactivo práctico

Pruebe este ejercicio completando este código de muestra.

# Store length of each row in survey_response column
resp_length = ____

# Find rows in airlines where resp_length > 40
airlines_survey = airlines[____ > ____]

# Assert minimum survey_response length is > 40
assert ____.str.len().____ > _____

# Print new survey_response column
print(airlines_survey['survey_response'])
Editar y ejecutar código