量化投資策略是否存在數據遷就偏差?

  |  

如果你構建一個有100個參數的策略,完全可能通過優化參數,使歷史業績看起來非常棒。同樣可能的是,該策略的未來業績與回測結果截然不同、非常槽糕。這麼多參數,只是使模型與過去發生但未來不會再重現的任何偶然歷史事件吻合。實際上,即使只有一兩個參數(如建倉和清倉閾值),也很難避免所謂數據遷就偏差,第3章會討論怎樣減小數據遷就偏差的影響。一般而言,策略的規則越多,模型的參數越多,就越有可能遭遇數據遷就偏差。能經得起時間考驗的往往是簡單的模型。

人工智能與選股

《紐約時報》前些日子發表過一篇文章,介紹了Ray Kurzweil先生新創立的一家對沖基金。Ray Kurzweil先生可稱得上是人工智能領域的先驅。(這裏要感謝我的博客讀者YaserAnwar,是他向我推薦了這篇文章。)據Kurzweil透露,他的基金的選股決策都是由機器完成的,“……能夠觀察數十億筆市場交易,從而發現那些人工無法察覺的模式”(Duhigg,2006)。


雖然我是一名算法交易的信徒,但是當我得知這一交易是基於“人工智能”方法的時候,我對此還是有些懷疑。

我們可以這樣簡單地理解人工智能(AI),它就是一個嘗試使用包含衆多參數的函數來擬合曆史數據的過程。AI常用的工具有:神經網絡、決策樹和遺傳算法。因爲包含的參數很多,我們可以相信它能夠捕獲到那些人類根本無法察覺到的細微模式。但是,這些模式能夠持續嗎?這些模式會不會只是一些不會重複的隨機噪聲?AI領城的專家們向我們保證他們有許多防範措施用以過濾那些瞬間噪聲。並且,這些工具也確實在消費者營銷和信用卡欺炸檢測上效果顯著。消費者行爲和作編行爲的模式顯然都具有較長的持續期,這使得這些AI算法即使包含大量參數也能有效運行。然而,以我的經驗來看,要對金融市場進行預測,這種防範措施是遠遠不夠的,並且時歷史數據嗓聲的過度擬合還會帶來嚴重後果。事實上,我以前也建立過許多基於AI算法的金融預測模型。每次我費盡心力所建立的那些在回測中業績優異的模型。在之後的實際交易中的業績卻令人十分失望。主要原因可能是,相對於可以獲取的大量相互獨立的消費者行爲和信用交易數據,我們能夠獲取的在統計學意義上相互獨立的金融數據的數量是非常有限的。(你可能會說,我們擁有大量分時金融數據可供使用。但實際上,這些數據是序列相關的,並不是相互獨立的。)

但這並不意味着所有基於AI的方法在進行預測時都是無效的。

我使用過的有效的AI方法通常具有以下幾個特徵:

·基於正確的計量經濟學或理論基礎,而不是隨機發現的模式。

·所需的參數用到歷史數據較少。

·只用到了線性迴歸,並未使用複雜的非線性函數。

·概念上很簡單。

·所有優化都必須在不含未來未知數據的移動回顧窗口中實現,並且這種優化的效果必須不斷地被未來未知的數據所證實。

只有滿足了這些約束條件的交易模型,我纔敢用我那少量且寶貴的歷史數據進行檢測。顯然,“奧卡姆剃刀原理”不僅在科學上有效,在金融上也是如此。

推薦閱讀

相關文章

5日均綫和10日均綫

均綫大多是主力操盤手臨盤決策的依據,所以散戶朋友對此應該有所洞悉,探明主力操盤軌跡是你首先要弄清楚的事情。今天先講攻擊綫(5日均綫)和操盤綫(10日均綫)。攻擊綫所謂攻擊綫就是我們日常所說的5日均綫。有的朋友覺得很可笑,五日均綫還用講嗎,這個傻瓜都知道。事實上問題就齣在這裏,越簡單的你反而不會花大力氣去學習深究其裏。

頂天立地K線形態?頂天立地形態的詳細分析及技術要點

當股市處於劇烈寬幅震盪行情中時,或者上市公司遇到突發消息時,個股會表現出劇烈震盪走勢,有些個股在某一交易日內出現振幅極爲巨大的陽線,有時最低價能夠接近跌停板,而當天最高價卻接近漲停。其中,K線實體的漲幅超過10%,這種K線形態被稱爲極度長陽線,出現極度長陽線的個股中將有相當一部分會在後市行情中出現急速機升的走勢。

KDJ指標買入及賣出信號

KDJ指標的實戰技巧主要集中在KDJ指標的“金叉”、“死叉”以及KDJ曲線所處的位置和KDJ曲線運行方向等三個方面。下面以分析家軟件上的日參數爲(89,9,12)的KDJ指標爲例,來揭示KDJ指標的買賣和觀望功能。

DIFF綫與DEA綫市場含義

一、MACD指標展示 MACD指標示意圖上圖是標示瞭股票行情軟件中的MACD指標示意圖,圖中,相對較細、波動較迅急的的麯綫是DIFF綫,波動相對平緩、較粗的麯綫則為DEA綫。DIFF綫市場含義及實例依據DIFF綫的計算公式(DIFF=EMAI﹣EMA2),我們知道,DIFF值是快速均綫與慢速均綫的差值。

如何騎短綫牛股

主力投巨資操作一隻股票,都是有預期收益目標的,這一目標通過股票的H標漲幅來體現和實現。也就是說,主力必須得把這隻股票拉到一定漲幅,纔能實現收益。具體到短綫牛股,隻要該短綫暴漲行情正式確立,這隻股票短期內不漲個40%、50%或以上,主力是絕不會罷休的。

人們爲什麼買股票

公司發行股票有很大的好處,那我們買股票又有什麼好處呢,是不是爲了能夠像那個賣橘子的人的朋友一樣分成呢?是這樣的,既然我們買了這個公司的股票,成了它的股東,也就理所當然地可以分享它的利益,或者說分紅。通常公司採用以下幾種方法來使它的股東得到好處:(1)分紅派息。

量化投資主要內容:商品期貨套利

商品期貨套利盈利的邏輯原理是基於以下幾個方面的:相關商品在不同地點、不同時間對應都有一個合理的價格差價;由於價格的波動性,價格差價經常出現不合理;不合理必然要回到合理;不合理回到合理的這部分價格區間就是盈利區間。

分時圖中的MACD實戰

個股的盤中運行常常會齣現強弱轉化,由強轉弱或者是由弱轉強,往往難以讓人把握,實盤操作中,結閤MACD指標綫的運行進行分析,可以得到更為準確的結論。弱勢股受均價綫壓製,這既體現在股價走勢上,也體現在MACD指標運行上。體現在MACD指標上的形態為:指標綫一直運行於0軸下方。

分形理論分形維數的分類

分形維數歐氏幾何學有着幾千年的歷史,它研究的是一些規整的圖形,如直線、圓、橢圓、菱形、正方形、立方體、長方體、球體等。這些不同類型的曲線和形狀都有一個共同的基礎—歐氏幾何,即它們可以被定義爲代數方程(例如,Ax+By+Cz=D)或微分方程的解集。

股票KDJ指標的使用技巧及注意事項

KDJ指標的使用技巧1.K與D值永遠介於0到100之間。D大於80時,行情呈現超買現象。D小於20時,行情呈現超賣現象。2.上漲趨勢中,K值大於D值,K線向上突破D線時,爲買進信號。下跌趨勢中,K值小於D值,K線向下跌破D線時,爲賣出信號。 3.KD指標不僅能反映出市場的超買超賣程度,還能通過交叉突破發出買賣信號。