Menggabungkan semuanya (1)
Ingatlah latihan Bringing it all together pada bab sebelumnya ketika Anda melakukan analisis Twitter sederhana dengan mengembangkan fungsi yang menghitung berapa banyak tweet dalam bahasa tertentu. Keluaran fungsi Anda adalah sebuah dictionary yang memiliki bahasa sebagai keys dan jumlah tweet dalam bahasa tersebut sebagai value.
Dalam latihan ini, kita akan menggeneralisasi analisis bahasa Twitter yang Anda lakukan di bab sebelumnya. Anda akan melakukannya dengan menyertakan argumen baku yang menerima nama kolom.
Agar lebih mudah, pandas telah diimpor sebagai pd dan berkas 'tweets.csv' telah diimpor ke dalam DataFrame tweets_df. Bagian kode dari pekerjaan Anda sebelumnya juga disediakan.
Latihan ini adalah bagian dari kursus
Pengantar Fungsi di Python
Petunjuk latihan
- Lengkapi header fungsi dengan menambahkan parameter untuk DataFrame
dfdan parametercol_namedengan nilai baku'lang'untuk nama kolom DataFrame. - Panggil
count_entries()dengan meneruskan DataFrametweets_dfdan nama kolom'lang'. Tetapkan hasilnya keresult1. Perhatikan bahwa karena'lang'adalah nilai baku dari parametercol_name, Anda tidak perlu menentukannya di sini. - Panggil
count_entries()dengan meneruskan DataFrametweets_dfdan nama kolom'source'. Tetapkan hasilnya keresult2.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Define count_entries()
def count_entries(____, ____):
"""Return a dictionary with counts of
occurrences as value for each key."""
# Initialize an empty dictionary: cols_count
cols_count = {}
# Extract column from DataFrame: col
col = df[col_name]
# Iterate over the column in DataFrame
for entry in col:
# If entry is in cols_count, add 1
if entry in cols_count.keys():
cols_count[entry] += 1
# Else add the entry to cols_count, set the value to 1
else:
cols_count[entry] = 1
# Return the cols_count dictionary
return cols_count
# Call count_entries(): result1
result1 = ____
# Call count_entries(): result2
result2 = ____
# Print result1 and result2
print(result1)
print(result2)