MulaiMulai sekarang secara gratis

Harga Saham Frekuensi Tinggi

Data saham frekuensi lebih tinggi umumnya dimodelkan dengan proses MA(1), sehingga ini merupakan penerapan yang baik dari model dalam bab ini.

DataFrame intraday memuat harga saham Sprint (simbol ticker "S") untuk satu hari (1 September 2017) yang diambil setiap satu menit. Bursa saham buka selama 6,5 jam (390 menit), dari pukul 9.30 hingga 16.00.

Sebelum Anda dapat menganalisis data runtun waktu, Anda perlu sedikit membersihkannya, yang akan Anda lakukan di latihan ini dan dua latihan berikutnya. Saat melihat beberapa baris pertama, Anda akan melihat beberapa hal. Pertama, tidak ada header kolom. Data tidak diberi cap waktu dari 9.30 hingga 16.00, melainkan dari 0 hingga 390. Anda juga akan melihat bahwa tanggal pertama tampak tidak biasa: "a1504272600". Angka setelah "a" adalah waktu Unix, yaitu jumlah detik sejak 1 Januari 1970. Inilah cara himpunan data ini memisahkan setiap hari data intraday.

Jika Anda melihat tipe data, Anda akan menemukan bahwa kolom DATE bertipe object, yang di sini berarti string. Anda perlu mengubahnya menjadi numerik sebelum dapat membersihkan beberapa data hilang.

Sumber data per menit ini adalah Google Finance (lihat di sini untuk cara pengunduhannya).

Modul datetime telah diimpor untuk Anda.

Latihan ini adalah bagian dari kursus

Analisis Deret Waktu dengan Python

Lihat Kursus

Petunjuk latihan

  • Ubah secara manual tanggal pertama menjadi nol menggunakan .iloc[0,0].
  • Ubah dua header kolom menjadi 'DATE' dan 'CLOSE' dengan menyetel intraday.columns sama dengan daftar yang berisi kedua string tersebut.
  • Gunakan atribut pandas .dtypes (tanpa tanda kurung) untuk melihat tipe data di setiap kolom.
  • Konversi kolom 'DATE' menjadi numerik menggunakan fungsi pandas to_numeric().
  • Jadikan kolom 'DATE' sebagai indeks baru intraday dengan menggunakan metode pandas .set_index(), yang akan menerima string 'DATE' sebagai argumennya (bukan seluruh kolom, hanya nama kolom).

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# import datetime module
import datetime

# Change the first date to zero
intraday.___ = 0

# Change the column headers to 'DATE' and 'CLOSE'
intraday.columns = ___

# Examine the data types for each column
print(intraday.dtypes)

# Convert DATE column to numeric
intraday['DATE'] = pd.to_numeric(____)

# Make the `DATE` column the new index
intraday = ____
Edit dan Jalankan Kode