Uso simples de .apply()

Vamos ganhar experiência prática com .apply()!

Você tem o conjunto de dados completo scores, com o desempenho dos alunos e informações de contexto.

Sua tarefa é definir a função prevalence() e aplicá-la às colunas groups_to_consider do DataFrame scores. Essa função deve recuperar o grupo/categoria mais prevalente para uma coluna específica (por exemplo, se a categoria mais frequente na coluna lunch for standard, então prevalence() deve retornar standard).

A função reduce() do módulo functools já foi importada.

Dica: pd.Series é um objeto iterável. Portanto, você pode usar operações padrão nele.

Este exercicio faz parte do curso

Praticando questões de entrevista de código em Python

Ver curso

Instruções do exercicio

Crie uma lista de tuplas com os itens únicos do objeto series passado e suas contagens.
Extraia a tupla com a maior contagem usando reduce().
Retorne o item com a maior contagem.
Aplique a função prevalence no DataFrame scores usando as colunas especificadas em groups_to_consider.

exercicio interativo prático

Tente este exercicio completando este código de exemplo.

def prevalence(series):
    vals = list(series)
    # Create a tuple list with unique items and their counts
    itms = [(____, ____) for x in set(____)]
    # Extract a tuple with the highest counts using reduce()
    res = reduce(lambda x, y: ____, ____)
    # Return the item with the highest counts
    return ____[____]

# Apply the prevalence function on the scores DataFrame
result = scores[groups_to_consider].____
print(result)

Editar e Executar Código