ComeçarComece de graça

Transformando e limpando DataFrames

Uma vez que os dados tenham sido organizados em uma estrutura de dados Python limpa, como uma lista de listas, é fácil convertê-los em um DataFrame pandas. Você praticará isso com os dados que foram selecionados no último exercício.

Como de costume, pandas foi importado como pd, e a variável normalized_testing_scores armazena a lista de dados de teste de cada escola, conforme mostrado abaixo.

[
    ['01M539', '111 Columbia Street', 'Manhattan', 657.0, 601.0, 601.0],
    ...
]   

Este exercício faz parte do curso

ETL e ELT em Python

Ver curso

Instruções do exercício

  • Crie um DataFrame pandas a partir da lista de listas armazenadas na variável normalized_testing_scores.
  • Defina os nomes das colunas para o DataFrame normalized_data.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Create a DataFrame from the normalized_testing_scores list
normalized_data = ____(normalized_testing_scores)

# Set the column names
normalized_data.____ = ["school_id", "street_address", "city", "avg_score_math", "avg_score_reading", "avg_score_writing"]

normalized_data = normalized_data.set_index("school_id")
print(normalized_data.head())
Editar e executar o código