Uso simple de .apply()
¡Vamos a conseguir algo de experiencia práctica con .apply()!
Tienes a tu disposición el conjunto completo scores, que contiene el rendimiento de los estudiantes y su información de contexto.
Tu tarea es definir la función prevalence() y aplicarla a las columnas groups_to_consider del DataFrame scores. Esta función debe obtener el grupo/categoría más frecuente de una columna dada (p. ej., si la categoría más frecuente en la columna lunch es standard, entonces prevalence() debe devolver standard).
La función reduce() del módulo functools ya está importada.
Consejo: pd.Series es un objeto iterable. Por lo tanto, puedes usar operaciones estándar sobre él.
Este ejercicio forma parte del curso
Practicing Coding Interview Questions in Python
Instrucciones del ejercicio
- Crea una lista de tuplas con los elementos únicos del objeto
seriespasado y sus conteos. - Extrae la tupla con el conteo más alto usando
reduce(). - Devuelve el elemento con el conteo más alto.
- Aplica la función prevalence al DataFrame
scoresusando las columnas especificadas engroups_to_consider.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
def prevalence(series):
vals = list(series)
# Create a tuple list with unique items and their counts
itms = [(____, ____) for x in set(____)]
# Extract a tuple with the highest counts using reduce()
res = reduce(lambda x, y: ____, ____)
# Return the item with the highest counts
return ____[____]
# Apply the prevalence function on the scores DataFrame
result = scores[groups_to_consider].____
print(result)