ComeçarComece de graça

Remoção de títulos e nomes

Ao coletar os metadados dos entrevistados da pesquisa no DataFrame airlines, o nome completo dos entrevistados foi salvo na coluna full_name. No entanto, após uma inspeção mais minuciosa, você descobriu que muitos dos nomes diferentes são prefixados por títulos honoríficos, como "Dr.", "Mr.", "Ms." e "Miss".

Seu objetivo final é criar duas novas colunas denominadas first_name e last_name, contendo o nome e o sobrenome dos entrevistados, respectivamente. Antes de fazer isso, porém, você precisa remover os honoríficos.

O DataFrame airlines está em seu ambiente, junto com pandas como pd.

Este exercício faz parte do curso

Limpeza de dados em Python

Ver curso

Instruções do exercício

  • Remova "Dr.", "Mr.", "Miss" e "Ms." de full_name, substituindo-os por uma string vazia "", nessa ordem.
  • Execute a instrução assert usando .str.contains() para testar se full_name ainda contém algum dos honoríficos.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Replace "Dr." with empty string ""
airlines['full_name'] = airlines['full_name'].____.____("____","")

# Replace "Mr." with empty string ""
airlines['full_name'] = ____

# Replace "Miss" with empty string ""
____

# Replace "Ms." with empty string ""
____

# Assert that full_name has no honorifics
assert airlines['full_name'].str.contains('Ms.|Mr.|Miss|Dr.').any() == False
Editar e executar o código