Resumos eficientes
Embora o pandas e o NumPy tenham inúmeras funções, às vezes você pode precisar de uma função diferente para resumir seus dados.
O método .agg()
permite aplicar suas próprias funções personalizadas a um DataFrame, bem como aplicar funções a mais de uma coluna de um DataFrame de uma só vez, tornando suas agregações supereficientes. Por exemplo:
df['column'].agg(function)
Na função personalizada deste exercício, "IQR" é a abreviação de intervalo interquartil (Inter-Quartile Range, em inglês), que é o 75º percentil menos o 25º percentil. É uma alternativa ao desvio-padrão que é útil se os dados contiverem valores discrepantes.
sales
já está disponível e pandas
foi carregado como pd
.
Este exercício faz parte do curso
Manipulação de dados com o pandas
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# A custom IQR function
def iqr(column):
return column.quantile(0.75) - column.quantile(0.25)
# Print IQR of the temperature_c column
print(____)