期刊VIP學(xué)術(shù)指導(dǎo) 符合學(xué)術(shù)規(guī)范和道德
保障品質(zhì) 保證專業(yè),沒有后顧之憂
來源:期刊VIP網(wǎng)所屬分類:經(jīng)濟(jì)學(xué)時間:瀏覽:次
摘要:本文針對我國期貨市場流動性較好的期貨品種,對比分析了時間時鐘(time clock)和成交量時鐘(volume clock)兩種行情采樣方法,研究發(fā)現(xiàn):相較于時間時鐘采樣方法,基于成交量時鐘采樣得到的數(shù)據(jù)序列成交量分布更均勻且肥尾效應(yīng)減弱,統(tǒng)計(jì)特性顯著改善。本文基于指數(shù)移動均線日內(nèi)策略對兩種采樣方法的組合績效進(jìn)行了實(shí)證研究,結(jié)果表明:基于成交量時鐘的組合績效在不同交易頻率下均有提高,且基于時間時鐘采樣的成交量波動率越大,績效的改善就越顯著,成交量時鐘采樣方法更適合用于較高頻率的策略。
關(guān)鍵詞:行情采樣方法 成交量時鐘 日內(nèi)策略 高頻交易
一、引言
基于量價信息的市場行情數(shù)據(jù)在二級市場的投資決策中是非常重要的一類數(shù)據(jù)輸入源,特別是對于基于小時級別以下K線序列的中高頻CTA策略和基于市場微觀結(jié)構(gòu)的高頻交易策略,交易決策的依據(jù)主要是基于量價信息提取的數(shù)據(jù)特征。市場行情數(shù)據(jù)是指交易所內(nèi)交易行為產(chǎn)生的信息流,國外發(fā)達(dá)國家的二級市場一般能夠向市場參與者提供實(shí)時的高頻分筆報撤單和逐筆成交回報數(shù)據(jù)(tick 數(shù)據(jù)),國內(nèi)的股票和期貨交易所一般僅能提供固定時間頻率的行情快照數(shù)據(jù)。中低頻量化交易策略大體上分為擇時策略和選股策略兩種類型,包括時間序列和橫截面兩個維度[1],無論是基于機(jī)器學(xué)習(xí)還是基于傳統(tǒng)統(tǒng)計(jì)方法的中低頻量化策略,非結(jié)構(gòu)的原始行情數(shù)據(jù)由于存在較多的噪音不能直接用于策略的統(tǒng)計(jì)建模,原始tick 數(shù)據(jù)一般需要通過采樣聚合等方法清洗加工成結(jié)構(gòu)化的數(shù)據(jù)序列,例如K線時間序列數(shù)據(jù)。
López de Prado(2019)[2]指出合理的數(shù)據(jù)分析和管理是構(gòu)建一套有效量化策略的關(guān)鍵環(huán)節(jié),學(xué)界和業(yè)界最常用的數(shù)據(jù)清洗加工方法是基于自然時間時鐘的數(shù)據(jù)采樣方法,即按一定的時間間隔進(jìn)行行情數(shù)據(jù)的采樣統(tǒng)計(jì),例如按年、日、小時、分鐘等頻率對行情數(shù)據(jù)進(jìn)行采樣以形成不同頻率的K線數(shù)據(jù)。基于時間時鐘的數(shù)據(jù)采樣方法符合人的直覺且操作簡單,但存在一些明顯的缺點(diǎn),López de Prado(2018)[3]指出傳統(tǒng)的時間時鐘采樣方法主要存在兩個主要問題:第一,市場中交易行為不按固定的時間頻率產(chǎn)生,即交易信息在時間維度上的分布不均勻,這會導(dǎo)致基于固定時間的行情采樣方法在交易活躍的時間段采樣不足,在交易寡淡的時間段又會過度采樣;第二,基于時間時鐘采樣得到的數(shù)據(jù)序列的統(tǒng)計(jì)特性較差,例如呈現(xiàn)序列自相關(guān)和異方差性,不滿足正態(tài)分布和獨(dú)立同分布等統(tǒng)計(jì)假設(shè),這會導(dǎo)致建模和計(jì)算更加復(fù)雜。
近些年來,隨著計(jì)算機(jī)技術(shù)的飛速發(fā)展,高頻交易已經(jīng)成為市場中不可忽視的一股力量,高頻交易由技術(shù)和數(shù)據(jù)進(jìn)行驅(qū)動,其交易信息主要是基于訂單流和限價訂單薄提取的市場微觀結(jié)構(gòu),其交易類型包括套利、做市、方向交易等[4]。高頻交易的收益主要來源于對市場微觀結(jié)構(gòu)中的信息識別,故其對數(shù)據(jù)的精細(xì)化處理和執(zhí)行速度的要求都異常苛刻,Easley等(2012)[5]指出高頻交易和中低頻量化交易之間除了廣為人知的速度差別外,更重要的是信息處理模式的進(jìn)化。中低頻策略一般是在時間時鐘的數(shù)據(jù)基礎(chǔ)上統(tǒng)計(jì)建模,而高頻交易是基于事件(event-based)來處理信息,市場微觀結(jié)構(gòu)的基本信息單元顯然不是按時間間隔等距分布,基于事件的數(shù)據(jù)處理方法更合乎邏輯[6]。基于成交量時鐘(volume clock)的數(shù)據(jù)處理方式就是一種典型的基于事件的信息處理方式,成交量時鐘是用一定數(shù)量的成交量作為“計(jì)時”單位,Easley等(2012)[5]研究表明基于成交量時鐘采樣得到的數(shù)據(jù)序列更接近正態(tài)分布,劉睿智(2016)[7]針對國內(nèi)滬深300股指期貨的研究同樣表明成交量時鐘采樣得到的收益率更接近正態(tài)分布,良好的統(tǒng)計(jì)特性可以大幅簡化策略開發(fā)流程和提高策略執(zhí)行的速度。高頻交易中知情交易者的逆向選擇有可能導(dǎo)致高頻做市商產(chǎn)生虧損,為了衡量高頻做市商面臨的這種訂單流毒性(Order Flow Toxicity)的大小,Easley等(2011)[8]提出了一種衡量訂單流毒性大小的指標(biāo)——基于成交量的知情交易概率(Volume-Synchronized Probability of Informed Trading,VPIN),其原理是以成交量時鐘做高頻數(shù)據(jù)統(tǒng)計(jì)的 “計(jì)時”工具,對交易的買賣量不平衡進(jìn)行量化,進(jìn)而計(jì)算得到訂單流毒性。另外,劉文文和張合金(2013)[9]針對我國滬深300股指期貨的研究也發(fā)現(xiàn)VPIN指標(biāo)可以很好地監(jiān)測市場大幅波動時的指令流毒性,基于成交量時鐘的VPIN指標(biāo)不僅可以被高頻做市商用作風(fēng)險管理工具,也可以被中低頻交易者和監(jiān)管機(jī)構(gòu)用來做極端風(fēng)險的警示。此外,Easley等(2012)[10]提出了基于成交量時鐘的整體交易分類方法(Bulk Volume Classification,BVC),主要是來估計(jì)主動買單和主動賣單的百分比,具體方法是在以成交量時鐘采樣得到的數(shù)據(jù)單元內(nèi),根據(jù)數(shù)據(jù)單元的起點(diǎn)和終點(diǎn)的價格變化來計(jì)算買賣交易量的百分比,Easley(2016)[11]和Panayides(2019)[12]進(jìn)一步研究表明BVC方法可以更好地分辨市場數(shù)據(jù)中的交易意圖。總而言之,成交量時鐘在高頻交易中的諸多應(yīng)用表明基于事件的信息處理模式能夠更有效地獲取市場中的有用信息。
本文的研究目的是探索基于成交量時鐘的信息處理模式在中高頻CTA策略中的應(yīng)用前景,本文余下的內(nèi)容:針對國內(nèi)期貨市場流動性較好的34個期貨品種,對比分析成交量時鐘和時間時鐘兩種采樣方法的統(tǒng)計(jì)特性,進(jìn)一步研究兩種采樣方法對典型CTA日內(nèi)策略績效的影響。為表述簡便,后文將時間時鐘和成交量時鐘分別簡述為“time clock”和“volume clock”,將基于成交量時鐘采樣得到的K線序列和基于成交量時鐘采樣得到的K線序列分別簡述為“time-bars”和“volume-bars”。
二、研究對象和方法
(一)研究對象
本文選取國內(nèi)期貨市場流動性較好的34個品種作為研究對象,所選取的期貨品種覆蓋國內(nèi)的四個期貨交易所:中國金融期貨交易所、上海期貨交易所、大連商品交易所、鄭州商品交易所,具體的期貨品種參見表1。本文研究的期貨行情原始tick數(shù)據(jù)源來自中泰證券(上海)資產(chǎn)管理有限公司的行情收錄數(shù)據(jù)庫,本文研究中的數(shù)據(jù)采樣和統(tǒng)計(jì)、日內(nèi)策略績效統(tǒng)計(jì)分析的時間區(qū)間為2015年5月4日至2020年 4月3日,測試的數(shù)據(jù)為各期貨品種的主力連續(xù)合約,數(shù)據(jù)在換月節(jié)點(diǎn)做差值前復(fù)權(quán)處理以消除換月產(chǎn)生的跳空缺口。
(二)行情采樣方法
針對原始tick數(shù)據(jù),分別基于自然時間時鐘(time clock)和成交量時鐘(volume clock)兩種方法對一分鐘頻率的數(shù)據(jù)進(jìn)行采樣。
1.time clock行情采樣方法。基于time clock的采樣方法是以固定的交易時間間隔做行情數(shù)據(jù)的采樣統(tǒng)計(jì),生成的K線序列time-bars。本文針對特定的交易品種,按各個期貨品種的實(shí)盤交易時段,在每個交易日的交易時段內(nèi)每間隔1分鐘對行情進(jìn)行一次采樣統(tǒng)計(jì),由1分鐘采樣時段內(nèi)的tick數(shù)據(jù)統(tǒng)計(jì)數(shù)據(jù)得到該1分鐘K線的開盤價、最高價、最低價、收盤價、成交量(K線內(nèi)的累積成交量)、持倉量(K線結(jié)束時刻的持倉量)等信息。
2.volume clock行情采樣方法。基于volume clock的行情采樣方法則是以固定的成交量間隔做行情數(shù)據(jù)的采樣統(tǒng)計(jì),生成的K線序列volume-bars。本文為方便對比分析兩種采樣方法產(chǎn)生K線序列的統(tǒng)計(jì)特性,在生成volume-bars的過程中保證每個交易日的volume-bars數(shù)量和time-bars數(shù)量相同。volume clock以固定成交量作為“計(jì)時器”,其計(jì)算如式(1)所示:
(1)
其中,是期貨品種j在交易日i內(nèi)的總成交量,是交易日i內(nèi)1分鐘頻率time-bars的總數(shù)量,計(jì)算得到的是期貨品種j在交易日i內(nèi)用volume clock采樣的成交量計(jì)數(shù)基準(zhǔn)。
三、time-clock和 volume-clock采樣方法的統(tǒng)計(jì)分析
針對國內(nèi)的34個期貨品種,具體對比分析time clock和volume clock兩種采樣方法對行情采樣結(jié)果統(tǒng)計(jì)特性的影響,本文主要分析成交量波動率、價格變動和真實(shí)波幅這三個指標(biāo)。
(一)成交量波動率
本文用采樣方法得到的time-bars和volume-bars的成交量分布的波動率來表征成交量分布的均勻性,其中單個期貨品種的成交量波動率定義如下:
(2)
其中,和分別表示第i個交易volume分布的標(biāo)準(zhǔn)差和均值,N為交易日的總天數(shù)。
圖1給出了不同品種在兩種采樣方法下的成交量波動率對比,可以看到,相比于傳統(tǒng)的time clock方法,volume clock采樣得到的成交量分布對于所有品種都有顯著的下降,即volume clock采樣方法使得成交量數(shù)據(jù)序列的分布更均勻。
(二)價格變動
本文用相鄰兩根K線收盤價變化的相對值來表征價格變動(Price Change,PC),具體如下式所示:
(3)
其中,表示時刻K線的收盤價,表示前一根K線的收盤價,本文主要考慮行情采樣方法對中高頻策略的影響,在計(jì)算相應(yīng)指標(biāo)時僅考慮日內(nèi)波動不計(jì)入隔日跳空,故針對每個交易日的第一根K線,用開盤價代替,且針對每個交易日的價格變動指標(biāo)用該交易日內(nèi)PC的均值和標(biāo)準(zhǔn)差做z-sore標(biāo)準(zhǔn)化。
本文用超額峰度來衡量不同期貨品種的價格變動PC的超額峰度(),的定義如式(4)所示。
(4)
由圖2可知,相較于time-bars,volume-bars價格變動指標(biāo)的超額峰度顯著減小,表明volume采樣方法可以降低價格變動分布的肥尾效應(yīng),價格變動的分布更接近正態(tài)分布,統(tǒng)計(jì)特性更好,有利于基于K線收盤價統(tǒng)計(jì)建模的策略。
(三)真實(shí)波幅
本文用真實(shí)波幅(True Range,TR)來衡量行情的波動,真實(shí)波幅用當(dāng)前K線的最高、最低價,以及前一根K線的收盤價進(jìn)行計(jì)算,具體如下所示:
(5)
其中,、分別代表時刻K線的最高價和最低價,為上一根K線的收盤價,針對每個交易日第一根K線的處理和PC指標(biāo)的計(jì)算一致,用開盤價代替,即不計(jì)入隔日跳空對TR的影響,僅考慮采樣方法對日內(nèi)連續(xù)行情的影響。和PC指標(biāo)類似,在每個交易日對指標(biāo)TR做z-score標(biāo)準(zhǔn)化。
本文用真實(shí)波幅的超額峰度來衡量不同行情采樣方法下日內(nèi)行情波動的肥尾程度,定義如下:
(6)
針對time-bars和volume-bars,不同期貨品種的對比如圖3所示。從圖中可以看到,volume clock采樣方法下的顯著低于time clock方法,表明volume采樣方法得到的價格波動率分布的肥尾效應(yīng)也顯著降低,TR分布更接近正態(tài)分布。TR代表K線的長度,衡量了單根K線的平均波動幅度,TR異常離群值的減少可以提高策略對行情劇烈變動的適應(yīng)性。
四、關(guān)于日內(nèi)策略的實(shí)證檢驗(yàn)和分析
上文的統(tǒng)計(jì)分析表明:針對1分鐘頻率的數(shù)據(jù),volume clock采樣得到的行情統(tǒng)計(jì)特性顯著優(yōu)于傳統(tǒng)time clock方法,K線收盤價分布和真實(shí)波幅分布的肥尾效應(yīng)都顯著降低,采樣數(shù)據(jù)上的異常離群值減少,分布相對更集中,交易信息的密度。下文進(jìn)一步實(shí)證分析不同行情采樣方法對典型日內(nèi)策略的績效影響,為保證研究的實(shí)用價值,在評價策略績效的過程中應(yīng)避免使用未來數(shù)據(jù),故后文在應(yīng)用volume clock進(jìn)行行情采樣的過程中,用歷史交易日成交量的指數(shù)加權(quán)平均值作為當(dāng)日總成交量的估計(jì)值,的計(jì)算如下:
(7)
其中,為第i日的成交量,為計(jì)算指數(shù)加權(quán)系數(shù)α的周期數(shù),本文設(shè)置為5,即用5日指數(shù)加權(quán)平均的日成交量作為i+1日總成交量的估計(jì)值,行情采樣的其他步驟和上文一致。
(一)日內(nèi)策略的邏輯
本文采用簡單的指數(shù)移動雙均線構(gòu)造日內(nèi)策略,迭代計(jì)算指數(shù)移動雙均線中的短期均線和長期均線,具體算法如(8)式和(9)式所示。
其中,和分別代表短期均線和長期均線的指數(shù)加權(quán)均值,和分別代表計(jì)算短期均線和長期均線的指數(shù)加權(quán)權(quán)重系數(shù),和分別是快線和慢線對應(yīng)的時間周期。
推薦閱讀:期貨相關(guān)的論文文獻(xiàn)多嗎 怎么找