Uso simple de .apply()

¡Vamos a conseguir algo de experiencia práctica con .apply()!

Tienes a tu disposición el conjunto completo scores, que contiene el rendimiento de los estudiantes y su información de contexto.

Tu tarea es definir la función prevalence() y aplicarla a las columnas groups_to_consider del DataFrame scores. Esta función debe obtener el grupo/categoría más frecuente de una columna dada (p. ej., si la categoría más frecuente en la columna lunch es standard, entonces prevalence() debe devolver standard).

La función reduce() del módulo functools ya está importada.

Consejo: pd.Series es un objeto iterable. Por lo tanto, puedes usar operaciones estándar sobre él.

Este ejercicio forma parte del curso

Practicing Coding Interview Questions in Python

Ver curso

Instrucciones del ejercicio

Crea una lista de tuplas con los elementos únicos del objeto series pasado y sus conteos.
Extrae la tupla con el conteo más alto usando reduce().
Devuelve el elemento con el conteo más alto.
Aplica la función prevalence al DataFrame scores usando las columnas especificadas en groups_to_consider.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

def prevalence(series):
    vals = list(series)
    # Create a tuple list with unique items and their counts
    itms = [(____, ____) for x in set(____)]
    # Extract a tuple with the highest counts using reduce()
    res = reduce(lambda x, y: ____, ____)
    # Return the item with the highest counts
    return ____[____]

# Apply the prevalence function on the scores DataFrame
result = scores[groups_to_consider].____
print(result)

Editar y ejecutar código