在本章開頭的部分,作者簡單介紹了多因子選股策略是如何在若干個有效因子的基礎之上進行構建的。隨後作者展示了兩個因子的實際案例,可以看到,流通市值因子和上個月收益反轉因子在所研究的樣本數據之上是兩個具有預測效力和盈利能力的選股因子。在這一節中, 作者就將這兩個因子組合成多因子模型並用來選擇股票,這樣的做法一來遵循循序漸進的過程,二來也簡化了多因子策略的複雜度,用最基本的兩個選股因子來做直觀的案例展示,從而方便讀者更好地瞭解多因子選股策略的整體框架。需要注意的是,本書中使用的兩個選股因子都在2014年年底和2015年年初出現了比較極端的失效情況,因此多因子選股策略會相應地經歷一個短暫但程度較大的回撤也是必然的結果,這在本節和後面章節中的實際案例裏都會有具體的體現。不過就多因子選股策略的本質而言,有效因子越多、因子配置越均衡,多因子選股策略受到單因子失效影響的程度也就會越小,這其實和投資組合配置的情況是類似的,實際交易中研究人員還是應該儘可能地多發掘出-些相關性較小的選股因子,從而增強多因子選股策略的穩健性。
爲了研究多因子選股策略,作者獲取的同樣是自1991 年1月開始直到2015年6月底結束的國內股票月度數據。所選股票的範圍酒蓋在深圳證券交易所進行交易的所有A股,包括主板、中小企業板和創業板三個板塊,以及在上海證券交易所進行交易的所有A股。月度數據則包括月末收盤時股票的復權後月度收益率,以及股票的月度流通市值,這其實與單個市值因子研究中的樣本數據完全一致。但是在進行線性迴歸之前,需要對流通市值進行對數化處理,其目的是爲了更好地反映出月度收益率和流通市值之間的線性關係。當然,還應該存在着更爲適合的數據預處理手段,使得因子和收益率之間的線性關係更加明晰。不過這屬於第2章2.2節中提到過的數據準備工作,不在本書討論範圍之內,因此不再做深入研究,讀者可以在研究過程中自行摸索合理的處理方法。
開始挑選股票進行買賣的時間同樣從2011年12月收盤開始,也就是說在回溯測試樣本中將一共交易四年半的時間。1991 年1月到2010年12月的所有月度流通市值數據和月度收益率則作爲開始買賣股票前的備用數據,不過對於本節中簡單的多因子選股策略而言也只需要用到2010年12月這一個月的數據。而在整個交易過程中,回溯動作也設定爲只進行買入和賣出操作,不進行賣空的操作,資金全部用於持有股票,與單因子的研究環境一致。
回溯測試的過程如下,在第一個選股和交易的時間點,即2010年12月收盤時,將此時所有股票的月收益率、流通市值與2011年1月的收益率進行匹配,並進行迴歸估計,如下所示:

式中,r,是2011年1月的月收益率;S,,是2010年12月收盤時股票的流通市值;r :是2010年12月的月收益率,通過估計該回歸式可以得到針對2011年1月的a、b、b:三個參數估計值。
首先將時間按月份向後推進,每-一個月都可以得到一組參數估計值,直到2015年6月收盤時結束,一共54組估計參數;然後將54個a進行平均得到a,將54個b平均得到歷,將54個br平均得到萬,那麼基於整個樣本所得到的最終迴歸結果就是

同第4章中所介紹的簡單擇時策略一樣, 作者在估計完迴歸式之後,又會將該回歸式用到相同的樣本數據上進行交易的模擬。雖然這樣會產生未來信息的問題,但是相對簡單的流程處理可以方便讀者進行理解。具體來說,就是在2010年12月收盤的選股時間點上,基於2010年12月所有股票的月度流通市值和月度收益率數據,使用最終得到的迴歸式計算得到所有股票在2011年1月的收益率的預測值。其次將股票按照收益率預測值從高到低進行排序,再按順序等分爲若干個部分,每一等份中的股票又按照等權重進行組合,也就是買入佔用的資金量相等的組合。然後在2011年2月底進行相同的排序和等分過程,各個等份中的股票組成基於預測收益率排序的變化而發生改變。之後每一個月收盤時都進行相同的操作,直到交易樣本結束即2015年6月收盤爲止。
排序完成之後的處理,與單因子的研究內容完全-致。首先根據每一個等份下長度爲54的收益率序列,計算出各個等份的平均月度收益情況,進而判斷多因子模型預測下一期收益率的整體趨勢性。不過由於多因子模型本身的作用不在於挑選合適的因子,因此這.部分的結果僅作參考,實際意義小於其在單因子研究中的作用。交易策略方面,則根據排序中的第一個等份選擇股票,這也就是每一個月多因子選股策略所選擇的股票組合。根據這個長度爲54的收益率序列,就可以計算出多因子選股策略的淨值走勢。需要指出的是,多因子選股模型預測的是下一個月各只股票的收益率水平,因此按預期收益從大到小排序,排序第一的股票就應該是建倉的選擇,這是符合交易邏輯的。而本書中挑選出來的兩個單因子恰好都是收益預期與因子大小具有反向關係,因此按照因子從小到大進行排序,建倉選擇纔是排序第--的股票組合。希望讀者能夠區分這之間的差別。
和單因子的研究設置相仿,作者將所有股票按照預期收益大小排序劃分爲3等份、10等份、30等份共三種情況來加以研究。