Praktische Anwendung (1)
Erinnere dich an die Übung in Praktische Anwendung im vorherigen Kapitel, in der du eine einfache Twitter-Analyse durchgeführt hast, indem du eine Funktion entwickelt hast, die zählt, wie viele Tweets in bestimmten Sprachen verfasst sind. Die Ausgabe deiner Funktion war ein Dictionary, das die Sprache als Schlüssel und die Anzahl der Tweets in dieser Sprache als Wert hatte.
In dieser Übung verallgemeinern wir die Twitter-Sprachanalyse, die du im vorherigen Kapitel durchgeführt hast. Das machst du, indem du ein Standardargument einfügst, das einen Spaltennamen enthält.
Der Einfachheit halber wurde pandas
als pd
importiert und die Datei 'tweets.csv'
wurde in den DataFrame tweets_df
importiert. Teile des Codes aus deiner früheren Arbeit werden ebenfalls bereitgestellt.
Diese Übung ist Teil des Kurses
Einführung in Funktionen in Python
Anleitung zur Übung
- Vervollständige den Funktionskopf, indem du den Parameter für einen DataFrame
df
und den Parametercol_name
mit dem Standardwert'lang'
für den DataFrame-Spaltennamen angibst. - Rufe
count_entries()
auf, indem du den DataFrametweets_df
und den Spaltennamen'lang'
übergibst. Weise das Ergebnisresult1
zu. Da'lang'
der Standardwert für den Parametercol_name
ist, musst du ihn hier nicht angeben. - Rufe
count_entries()
auf, indem du den DataFrametweets_df
und den Spaltennamen'source'
übergibst. Weise das Ergebnisresult2
zu.
Interaktive Übung zum Anfassen
Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.
# Define count_entries()
def count_entries(____, ____):
"""Return a dictionary with counts of
occurrences as value for each key."""
# Initialize an empty dictionary: cols_count
cols_count = {}
# Extract column from DataFrame: col
col = df[col_name]
# Iterate over the column in DataFrame
for entry in col:
# If entry is in cols_count, add 1
if entry in cols_count.keys():
cols_count[entry] += 1
# Else add the entry to cols_count, set the value to 1
else:
cols_count[entry] = 1
# Return the cols_count dictionary
return cols_count
# Call count_entries(): result1
result1 = ____
# Call count_entries(): result2
result2 = ____
# Print result1 and result2
print(result1)
print(result2)