ComeçarComece de graça

Mantendo-o descritivo

Para entender melhor as experiências dos viajantes no aeroporto de São Francisco, o departamento de garantia de qualidade enviou um questionário qualitativo a todos os viajantes que deram ao aeroporto a pior pontuação em todas as categorias possíveis. O objetivo desse questionário é identificar padrões comuns no que os viajantes estão dizendo sobre o aeroporto.

Suas respostas estão armazenadas na coluna survey_response. Após uma análise mais detalhada, você percebeu que algumas das respostas apresentavam a menor quantidade possível de caracteres sem muita substância. Neste exercício, você isolará as respostas com uma contagem de caracteres superior a 40 e garantirá que seu novo DataFrame contenha respostas com 40 caracteres ou mais usando uma instrução assert.

O DataFrame airlines está em seu ambiente e pandas é importado como pd.

Este exercício faz parte do curso

Limpeza de dados em Python

Ver curso

Instruções do exercício

  • Usando o DataFrame airlines, armazene o comprimento de cada instância na coluna survey_response em resp_length usando .str.len().
  • Isole as linhas de airlines com resp_length maior que 40.
  • Afirme que o menor comprimento de survey_response em airlines_survey agora é maior do que em 40.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Store length of each row in survey_response column
resp_length = ____

# Find rows in airlines where resp_length > 40
airlines_survey = airlines[____ > ____]

# Assert minimum survey_response length is > 40
assert ____.str.len().____ > _____

# Print new survey_response column
print(airlines_survey['survey_response'])
Editar e executar o código