Muat beberapa file data
Tidak masalah jika Anda mengimpor beberapa himpunan data secara manual. Namun, ada kalanya Anda ingin mengimpor banyak himpunan data tanpa harus memanggil read_csv() berkali-kali.
Anda dapat menggunakan pustaka glob bawaan Python untuk mencari file yang cocok dengan suatu pola.
Pustaka ini disebut "glob" karena "globbing" adalah cara penentuan pola di shell Bash.
Fungsi glob() mengembalikan daftar nama file yang cocok dengan pola tertentu.
Anda kemudian dapat menggunakan list comprehension untuk mengimpor banyak file ke dalam sebuah list, lalu mengekstrak DataFrame yang Anda perlukan.
Latihan ini adalah bagian dari kursus
Python untuk Pengguna R
Petunjuk latihan
- Dapatkan daftar semua file csv di direktori Anda saat ini dan simpan ke
csv_files. - Tulis list comprehension yang membaca semua file
csvke dalam sebuah list,dfs. - Tulis list comprehension yang melihat
.shapedari setiap DataFrame dalam list tersebut.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
import glob
import pandas as pd
# Get a list of all the csv files
csv_files = glob.____('*.csv')
# List comprehension that loads of all the files
dfs = [pd.read_csv(____) for ____ in ____]
# List comprehension that looks at the shape of all DataFrames
print(____)