Mengintegrasikan semuanya (1)
Anda telah mulai menulis fungsi Anda sendiri pada latihan sebelumnya. Anda telah mempelajari cara menambahkan parameter ke definisi fungsi Anda, mengembalikan satu atau beberapa nilai dengan tuple, serta cara memanggil fungsi yang telah Anda definisikan.
Dalam latihan ini dan berikutnya, Anda akan menggabungkan semua konsep tersebut dan menerapkannya pada masalah data science yang sederhana. Anda akan memuat sebuah himpunan data dan mengembangkan fungsionalitas untuk mengekstrak wawasan sederhana dari data.
Pada latihan ini, tujuan Anda adalah mengingat kembali cara memuat himpunan data ke dalam sebuah DataFrame. Himpunan data ini berisi data Twitter dan Anda akan melakukan iterasi pada entri dalam sebuah kolom untuk membangun sebuah dictionary yang key-nya adalah nama bahasa dan value-nya adalah jumlah tweet dalam bahasa tersebut. Berkas tweets.csv tersedia di direktori Anda saat ini.
Harap diketahui bahwa ini adalah data asli dari Twitter dan karena itu selalu ada kemungkinan mengandung kata-kata kasar atau konten lain yang menyinggung (dalam latihan ini, dan latihan berikutnya yang juga menggunakan data Twitter asli).
Latihan ini adalah bagian dari kursus
Pengantar Fungsi di Python
Petunjuk latihan
- Impor paket pandas dengan alias
pd. - Impor berkas
'tweets.csv'menggunakan fungsi pandasread_csv(). Tetapkan DataFrame hasilnya kedf. - Lengkapi perulangan
fordengan melakukan iterasi padacol, yaitu kolom'lang'dalam DataFramedf. - Lengkapi isi pernyataan
if-elsedi dalam perulangan: jika key ada dalam dictionarylangs_count, tambahkan1pada nilai yang sesuai dengan key tersebut di dictionary, jika tidak tambahkan key kelangs_countdan tetapkan nilainya menjadi1. Gunakan variabel perulanganentrydalam kode Anda.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Import pandas
# Import Twitter data as DataFrame: df
df = ____
# Initialize an empty dictionary: langs_count
langs_count = {}
# Extract column from DataFrame: col
col = df['lang']
# Iterate over lang column in DataFrame
for entry in ____:
# If the language is in langs_count, add 1
if entry in langs_count.keys():
____
# Else add the language to langs_count, set the value to 1
else:
____
# Print the populated dictionary
print(langs_count)