Transformando dados de vendas com pandas
Antes que os insights possam ser extraídos de um conjunto de dados, os tipos de coluna podem precisar ser alterados para aproveitar adequadamente os dados. Isso é especialmente comum com tipos de dados temporais, que podem ser armazenados de várias maneiras diferentes.
Para este exemplo, pandas
foi importado como pd
e está pronto para você usar.
Este exercício faz parte do curso
ETL e ELT em Python
Instruções do exercício
- Atualize a função
transform()
para converter os dados da coluna"Order Date"
para o tipodatetime
. - Filtre o DataFrame para que ele contenha apenas linhas com
"Price Each"
menos de dez dólares. - Imprima os tipos de dados de cada coluna no DataFrame.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
raw_sales_data = extract("sales_data.csv")
def transform(raw_data):
# Convert the "Order Date" column to type datetime
raw_data["Order Date"] = pd.____(____, format="%m/%d/%y %H:%M")
# Only keep items under ten dollars
clean_data = raw_data.loc[____, :]
return clean_data
clean_sales_data = transform(raw_sales_data)
# Check the data types of each column
print(____)