Menjelajah data train
Anda akan bekerja dengan kompetisi Kaggle lain bernama "Store Item Demand Forecasting Challenge". Dalam kompetisi ini, Anda diberikan data penjualan store-item selama 5 tahun, dan diminta untuk memprediksi penjualan selama 3 bulan untuk 50 item berbeda di 10 toko berbeda.
Untuk memulai, mari menjelajah data train untuk kompetisi ini. Agar kinerja lebih cepat, Anda akan bekerja dengan subset data train yang hanya berisi riwayat satu bulan.
Tujuan awal Anda adalah membaca data masukan dan melihat sekilas isinya.
Latihan ini merupakan bagian dari kursus
Memenangi Kompetisi Kaggle dengan Python
Instruksi latihan
- Impor
pandassebagaipd. - Baca data train menggunakan metode
read_csv()daripandas. - Cetak head dari data train (menggunakan metode
head()) untuk melihat contoh data.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Import pandas
import ____ as pd
# Read train data
train = pd.____('train.csv')
# Look at the shape of the data
print('Train shape:', train.shape)
# Look at the head() of the data
print(train.____())