BaşlayınÜcretsiz Başlayın

Yüksek Frekanslı Hisse Senedi Fiyatları

Daha yüksek frekanslı hisse senedi verileri genellikle MA(1) süreciyle iyi modellenir; bu yüzden bu bölümdeki modellere güzel bir uygulamadır.

intraday DataFrame'i, Sprint hissesinin (sembolü "S") bir günlük fiyatlarını (1 Eylül 2017) bir dakikalık frekansta içerir. Borsa 6,5 saat (390 dakika) açıktır; 9:30'dan 16:00'ya kadar.

Zaman serisi verisini analiz etmeden önce biraz temizlemen gerekir; bunu bu egzersizde ve sonraki iki egzersizde yapacaksın. İlk birkaç satıra baktığında birkaç şey fark edeceksin. Öncelikle sütun başlıkları yok. Veriler 9:30'dan 16:00'ya zaman damgasıyla değil, 0'dan 390'a doğru gidiyor. Ayrıca ilk tarihin "a1504272600" gibi garip göründüğünü fark edeceksin. "a" harfinden sonraki sayı, 1 Ocak 1970'ten bu yana saniye cinsinden Unix zamanıdır. Bu veri kümesi, gün içi verilerde her günü bu şekilde ayırır.

Veri türlerine bakarsan, DATE sütununun bir nesne (yani burada bir string) olduğunu görürsün. Bazı eksik verileri temizleyebilmeden önce bunu sayısala çevirmen gerekecek.

Dakikalık verinin kaynağı Google Finance'tir (verinin nasıl indirildiği için bkz. burası).

datetime modülü senin için zaten içe aktarıldı.

Bu egzersiz

Python ile Zaman Serisi Analizi

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • İlk tarihi .iloc[0,0] kullanarak elle sıfıra çevir.
  • İki sütun başlığını, intraday.columns'ı bu iki dizgeyi içeren bir listeye eşitleyerek 'DATE' ve 'CLOSE' olarak değiştir.
  • Her sütundaki veri tiplerini görmek için parantezsiz pandas özniteliği .dtypes'ı kullan.
  • 'DATE' sütununu pandas fonksiyonu to_numeric() ile sayısala dönüştür.
  • 'DATE' sütununu intraday için yeni indeks yap. Bunun için pandas yöntemi .set_index()'i kullan; bu yöntem argüman olarak yalnızca 'DATE' dizgesini alır (tüm sütunu değil, yalnızca sütunun adını).

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# import datetime module
import datetime

# Change the first date to zero
intraday.___ = 0

# Change the column headers to 'DATE' and 'CLOSE'
intraday.columns = ___

# Examine the data types for each column
print(intraday.dtypes)

# Convert DATE column to numeric
intraday['DATE'] = pd.to_numeric(____)

# Make the `DATE` column the new index
intraday = ____
Kodu Düzenle ve Çalıştır