Transformando e limpando DataFrames
Uma vez que os dados tenham sido organizados em uma estrutura de dados Python limpa, como uma lista de listas, é fácil convertê-los em um DataFrame pandas
. Você praticará isso com os dados que foram selecionados no último exercício.
Como de costume, pandas
foi importado como pd
, e a variável normalized_testing_scores
armazena a lista de dados de teste de cada escola, conforme mostrado abaixo.
[
['01M539', '111 Columbia Street', 'Manhattan', 657.0, 601.0, 601.0],
...
]
Este exercício faz parte do curso
ETL e ELT em Python
Instruções do exercício
- Crie um DataFrame
pandas
a partir da lista de listas armazenadas na variávelnormalized_testing_scores
. - Defina os nomes das colunas para o DataFrame
normalized_data
.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Create a DataFrame from the normalized_testing_scores list
normalized_data = ____(normalized_testing_scores)
# Set the column names
normalized_data.____ = ["school_id", "street_address", "city", "avg_score_math", "avg_score_reading", "avg_score_writing"]
normalized_data = normalized_data.set_index("school_id")
print(normalized_data.head())