Unirlo todo (1)
Recuerda el ejercicio Unirlo todo del capítulo anterior, en el que realizaste un sencillo análisis de Twitter donde desarrollaste una función que cuenta cuántos tuits están en determinados idiomas. La salida de tu función era un diccionario que tenía el idioma como clave y el recuento de tuits en ese idioma como valor.
En este ejercicio, generalizaremos el análisis del lenguaje Twitter que hiciste en el capítulo anterior. Lo harás incluyendo un argumento predeterminado que tome un nombre de columna.
Para tu comodidad, pandas
se ha importado como pd
y el archivo 'tweets.csv'
se ha importado en el DataFrame tweets_df
. También se proporcionan partes del código de tu trabajo anterior.
Este ejercicio forma parte del curso
Introducción a las funciones en Python
Instrucciones de ejercicio
- Completa el encabezado de la función al proporcionar el parámetro de un DataFrame
df
y el parámetrocol_name
con el valor predeterminado'lang'
para el nombre de la columna del DataFrame. - Llama a
count_entries()
y pásale el DataFrametweets_df
y el nombre de la columna'lang'
. Asigna el resultado aresult1
. Ten en cuenta que, como'lang'
es el valor predeterminado del parámetrocol_name
, no tienes que especificarlo aquí. - Llama a
count_entries()
y pásale el DataFrametweets_df
y el nombre de la columna'source'
. Asigna el resultado aresult2
.
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# Define count_entries()
def count_entries(____, ____):
"""Return a dictionary with counts of
occurrences as value for each key."""
# Initialize an empty dictionary: cols_count
cols_count = {}
# Extract column from DataFrame: col
col = df[col_name]
# Iterate over the column in DataFrame
for entry in col:
# If entry is in cols_count, add 1
if entry in cols_count.keys():
cols_count[entry] += 1
# Else add the entry to cols_count, set the value to 1
else:
cols_count[entry] = 1
# Return the cols_count dictionary
return cols_count
# Call count_entries(): result1
result1 = ____
# Call count_entries(): result2
result2 = ____
# Print result1 and result2
print(result1)
print(result2)