Agregando recursos numéricos
Um bom caso de uso para criar um novo recurso a partir de uma estatística agregada é quando você tem muitas variáveis com valores semelhantes e relacionados. Aqui, você tem um DataFrame com tempos de corrida chamado running_times_5k. Para cada name no conjunto de dados, calcule a média dos 5 tempos de corrida dessa pessoa.
Este exercício faz parte do curso
Pré-processamento para Machine Learning em Python
Instruções do exercício
- Use o método
.loc[]para selecionar todas as linhas e colunas e encontrar o.mean()de cada coluna. - Imprima o
.head()do DataFrame para ver a colunamean.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Use .loc to create a mean column
running_times_5k["mean"] = ____.loc[____, ____].____(axis=____)
# Take a look at the results
print(____)