Mantendo-o descritivo
Para entender melhor as experiências dos viajantes no aeroporto de São Francisco, o departamento de garantia de qualidade enviou um questionário qualitativo a todos os viajantes que deram ao aeroporto a pior pontuação em todas as categorias possíveis. O objetivo desse questionário é identificar padrões comuns no que os viajantes estão dizendo sobre o aeroporto.
Suas respostas estão armazenadas na coluna survey_response
. Após uma análise mais detalhada, você percebeu que algumas das respostas apresentavam a menor quantidade possível de caracteres sem muita substância. Neste exercício, você isolará as respostas com uma contagem de caracteres superior a 40 e garantirá que seu novo DataFrame contenha respostas com 40 caracteres ou mais usando uma instrução assert
.
O DataFrame airlines
está em seu ambiente e pandas
é importado como pd
.
Este exercício faz parte do curso
Limpeza de dados em Python
Instruções do exercício
- Usando o DataFrame
airlines
, armazene o comprimento de cada instância na colunasurvey_response
emresp_length
usando.str.len()
. - Isole as linhas de
airlines
comresp_length
maior que40
. - Afirme que o menor comprimento de
survey_response
emairlines_survey
agora é maior do que em40
.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Store length of each row in survey_response column
resp_length = ____
# Find rows in airlines where resp_length > 40
airlines_survey = airlines[____ > ____]
# Assert minimum survey_response length is > 40
assert ____.str.len().____ > _____
# Print new survey_response column
print(airlines_survey['survey_response'])