我的美食可能是你的毒藥
當你要認清你不願意面對的事實再閱讀
上圖為市面上常見而明顯且典型的錯誤歷史資料
拿來做回測績效絕對不能信!!!
更何況拿來實戰......
坊間一般取得台指期的資料不外乎
1. 劵商提供
2. 討論區某某交易大師友情分享
3. 在知名拍賣網站上購買
4. 向知名程式交易商購買
劵商提供intraday只有短短一個月,而日線所包含的訊息太少
使用起來風險太高,不適合用來回測。
討論區上流傳的資料都有共通的問題:
a. 資料的來源參差不齊
討論區所分享的資料不外乎從上述1.、3.、4.中取得
再加上自己的拼湊,然而3.、4.都有含有大量錯誤。
b. 時間長度太短
只有2、3年時間,要知道回測是程式交易中最重要的一環
而回測台指至少要7年以上(包含多空) 才具意義
短時間的回測會造成最佳化後賠錢的聖盃
c. K線間隔太長
K線多為15分鐘、30分鐘
絕對會造成寫程式交易先天上的限制
無論你在寫波段亦或當沖的程式
一天區區只有6根、12根的K線
是贏不過別人使用1分K,1天300根的程式
更別說高手在使用tick,1天10萬筆資料的程式交易系統。
因為K線越短、數量越多
所包含的訊息越完整,回測才不會失真。
網路上販賣的資料其實“錯~很~大”:
d. 資料的來源有誤:
資料的來源不外乎從上述1.、2.、4.中取得
不然就是販賣自己收集DDE的資料
有些販賣者有良心會註明
「資料為DDE的資料,沒辦法保證資料的真實性」
有些則不註明。
然而這些都是完全不能用的資料
在上面做回測,根本沒有可信度
更別說是網路上用這些資料
來販賣自己的程式交易系統“所創出來”的績效報表
e. 量不正確甚至沒有量
台指期的資料
其中成交量(volume)所包含的訊息非常重要
因為大戶、法人能夠影響台灣市場
他們的單、量具指標意義
我看過有人只用量就能寫出好的程式
然而坊間的資料,不是量不正確就是沒有量
我推測這是資料源的混亂與DDE收集所造成的
感謝學生的提供以下是擷取一些網路上與知名交易商販賣的資料:
intrday:價不準、量不對
台灣期貨交易所2008年8月12日公布的收盤價為7270
資料上顯示收盤價為7280,相差10點(合理範圍 ±1點)
且當根K棒的量也異常,資料明顯有誤!!
2007年3月28日以前每天成交量只有7、8千口
2007年3月29日以後每天成交量上萬口
這明顯來自不同的資料源,是販賣者拼湊而成的
坊間的資料都存在著a.~e.的問題
用這些資料來做回測根本沒有意義做出來的程式根本不能信
那些販賣程式的人也應該要提出他的資料來源
否則那只是你不敢用,而拿出來賣給投資人使用的最佳理由。
程式交易的同好,當你拿到所謂的歷史資料
真的要好好的去檢視每一筆的正確性
因為你做出來的程式之所以會賠錢
或許不是程式本身的好壞
系統風險的存在;
最大的問題,就是你是用了錯誤的歷史資料
而這些是販賣歷史資料、程式交易的人不能說的秘密!!