Remoção de títulos e nomes
Ao coletar os metadados dos entrevistados da pesquisa no DataFrame airlines
, o nome completo dos entrevistados foi salvo na coluna full_name
. No entanto, após uma inspeção mais minuciosa, você descobriu que muitos dos nomes diferentes são prefixados por títulos honoríficos, como "Dr."
, "Mr."
, "Ms."
e "Miss"
.
Seu objetivo final é criar duas novas colunas denominadas first_name
e last_name
, contendo o nome e o sobrenome dos entrevistados, respectivamente. Antes de fazer isso, porém, você precisa remover os honoríficos.
O DataFrame airlines
está em seu ambiente, junto com pandas
como pd.
Este exercício faz parte do curso
Limpeza de dados em Python
Instruções do exercício
- Remova
"Dr."
,"Mr."
,"Miss"
e"Ms."
defull_name
, substituindo-os por uma string vazia""
, nessa ordem. - Execute a instrução
assert
usando.str.contains()
para testar sefull_name
ainda contém algum dos honoríficos.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Replace "Dr." with empty string ""
airlines['full_name'] = airlines['full_name'].____.____("____","")
# Replace "Mr." with empty string ""
airlines['full_name'] = ____
# Replace "Miss" with empty string ""
____
# Replace "Ms." with empty string ""
____
# Assert that full_name has no honorifics
assert airlines['full_name'].str.contains('Ms.|Mr.|Miss|Dr.').any() == False