Agregação de recursos numéricos
Um bom caso de uso para usar uma estatística agregada para criar um novo recurso é quando você tem muitos recursos com valores semelhantes e relacionados. Aqui, você tem um DataFrame de tempos de execução chamado running_times_5k
. Para cada name
no conjunto de dados, calcule a média de seus 5 tempos de execução.
Este exercício faz parte do curso
Pré-processamento para aprendizado de máquina em Python
Instruções de exercício
- Use o método
.loc[]
para selecionar todas as linhas e colunas e encontrar o.mean()
de cada coluna. - Imprima o endereço
.head()
do DataFrame para ver a colunamean
.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Use .loc to create a mean column
running_times_5k["mean"] = ____.loc[____, ____].____(axis=____)
# Take a look at the results
print(____)