Uso simples de .apply()
Vamos ganhar experiência prática com .apply()!
Você tem o conjunto de dados completo scores, com o desempenho dos alunos e informações de contexto.
Sua tarefa é definir a função prevalence() e aplicá-la às colunas groups_to_consider do DataFrame scores. Essa função deve recuperar o grupo/categoria mais prevalente para uma coluna específica (por exemplo, se a categoria mais frequente na coluna lunch for standard, então prevalence() deve retornar standard).
A função reduce() do módulo functools já foi importada.
Dica: pd.Series é um objeto iterável. Portanto, você pode usar operações padrão nele.
Este exercício faz parte do curso
Praticando questões de entrevista de código em Python
Instruções do exercício
- Crie uma lista de tuplas com os itens únicos do objeto
seriespassado e suas contagens. - Extraia a tupla com a maior contagem usando
reduce(). - Retorne o item com a maior contagem.
- Aplique a função prevalence no DataFrame
scoresusando as colunas especificadas emgroups_to_consider.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
def prevalence(series):
vals = list(series)
# Create a tuple list with unique items and their counts
itms = [(____, ____) for x in set(____)]
# Extract a tuple with the highest counts using reduce()
res = reduce(lambda x, y: ____, ____)
# Return the item with the highest counts
return ____[____]
# Apply the prevalence function on the scores DataFrame
result = scores[groups_to_consider].____
print(result)