ComenzarEmpieza gratis

Hashtags y menciones en tuits en ruso

Volvamos al dataframe tweets que contiene los tuits en ruso. En este ejercicio, vas a calcular el número de hashtags y de menciones en cada tuit definiendo dos funciones, count_hashtags() y count_mentions(), respectivamente, y aplicándolas a la característica content de tweets.

Por si no lo recuerdas, los tuits están en la característica content de tweets.

Este ejercicio forma parte del curso

Ingeniería de características para NLP en Python

Ver curso

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Function that returns numner of hashtags in a string
def count_hashtags(string):
	# Split the string into words
    words = string.split()
    
    # Create a list of words that are hashtags
    hashtags = [word for word in words if ____.____(____)]
    
    # Return number of hashtags
    return(len(hashtags))

# Create a feature hashtag_count and display distribution
tweets['hashtag_count'] = tweets['content'].apply(count_hashtags)
tweets['hashtag_count'].hist()
plt.title('Hashtag count distribution')
plt.show()
Editar y ejecutar código