Menjelajah data train
Anda akan bekerja dengan kompetisi Kaggle lain bernama "Store Item Demand Forecasting Challenge". Dalam kompetisi ini, Anda diberikan data penjualan store-item selama 5 tahun, dan diminta untuk memprediksi penjualan selama 3 bulan untuk 50 item berbeda di 10 toko berbeda.
Untuk memulai, mari menjelajah data train untuk kompetisi ini. Agar kinerja lebih cepat, Anda akan bekerja dengan subset data train yang hanya berisi riwayat satu bulan.
Tujuan awal Anda adalah membaca data masukan dan melihat sekilas isinya.
Latihan ini adalah bagian dari kursus
Memenangi Kompetisi Kaggle dengan Python
Petunjuk latihan
- Impor
pandassebagaipd. - Baca data train menggunakan metode
read_csv()daripandas. - Cetak head dari data train (menggunakan metode
head()) untuk melihat contoh data.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Import pandas
import ____ as pd
# Read train data
train = pd.____('train.csv')
# Look at the shape of the data
print('Train shape:', train.shape)
# Look at the head() of the data
print(train.____())