Aplicação de transformações avançadas a DataFrames
pandas
tem uma infinidade de ferramentas de transformação incorporadas, mas, às vezes, é necessário usar uma lógica mais avançada em uma transformação. A função apply
permite que você aplique uma função definida pelo usuário a uma linha ou coluna de um DataFrame, abrindo a porta para transformação avançada e geração de recursos.
A função find_street_name()
analisa o nome da rua do site "street_address"
, eliminando o número da rua da cadeia. Essa função foi carregada na memória e está pronta para ser aplicada ao DataFrame raw_testing_scores
.
Este exercício faz parte do curso
ETL e ELT em Python
Instruções de exercício
- Na definição da função
transform()
, use a funçãofind_street_name()
para criar uma nova coluna com o nome"street_name"
. - Use a função
transform()
para limpar o DataFrameraw_testing_scores
. - Imprima o cabeçalho do DataFrame
cleaned_testing_scores
, observando a nova coluna"street_name"
.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
def transform(raw_data):
# Use the apply function to extract the street_name from the street_address
raw_data["street_name"] = raw_data.____(
# Pass the correct function to the apply method
____,
axis=1
)
return raw_data
# Transform the raw_testing_scores DataFrame
cleaned_testing_scores = ____(raw_testing_scores)
# Print the head of the cleaned_testing_scores DataFrame
print(cleaned_testing_scores.____())