機(jī)器學(xué)習(xí)專題研究:Adaboost算法下的多因子選股
摘要: Adaboost算法Adaboost是一種迭代算法,其核心思想是針對同一個訓(xùn)練集訓(xùn)練不同的弱分類器,尤其是對難以正確分類的數(shù)據(jù)重復(fù)進(jìn)行訓(xùn)練,然后把這些弱分類器集合起來,構(gòu)成一個更強(qiáng)的強(qiáng)分類器。其算法本
Adaboost算法
Adaboost是一種迭代算法,其核心思想是針對同一個訓(xùn)練集訓(xùn)練不同的弱分類器,尤其是對難以正確分類的數(shù)據(jù)重復(fù)進(jìn)行訓(xùn)練,然后把這些弱分類器集合起來,構(gòu)成一個更強(qiáng)的強(qiáng)分類器。其算法本身是通過改變數(shù)據(jù)分布來實(shí)現(xiàn)的,它根據(jù)每次訓(xùn)練集之中每個樣本的分類是否正確,以及上次的總體分類的準(zhǔn)確率,來調(diào)整每個樣本的權(quán)值,這樣使得難以正確分類的數(shù)據(jù)得到訓(xùn)練。將修改過權(quán)值的新數(shù)據(jù)集送給下層分類器進(jìn)行訓(xùn)練,最后將每次訓(xùn)練得到的分類器最后融合起來,作為最后的決策分類器。
選股實(shí)證
由Adaboost算法得到的強(qiáng)勢組合能夠跑贏市場,且強(qiáng)勢組合,市場指數(shù),弱勢組合之間的較為明顯的凈值差別,算法所構(gòu)造的組合具有明顯的區(qū)分度,類似我們也發(fā)現(xiàn)所有十檔組合之間都有一定程度間隔,說明算法具有有效性。
對比Adaboost方法的結(jié)果,回歸方法產(chǎn)生的組合從凈值數(shù)據(jù)上不管是強(qiáng)勢組還是弱勢組都是優(yōu)于Adaboost算法的。由回歸方法與Adaboost算法的凈值比圖來看,雖然兩種方法在回測期截止凈值相同,但回歸方法產(chǎn)生的組合最高凈值更高。當(dāng)然,可以發(fā)現(xiàn)的是,回歸法的波動明顯比Adaboost算法大,尤其有市場振蕩時期?;贏daboost算法的多因子模型在組合凈值的波動率水平上仍有亮點(diǎn)
Adaboost因子與傳統(tǒng)因子
從凈值曲線上看,考慮了因子大類后的算法選股組合的區(qū)分度更高。強(qiáng)勢組合與弱勢組合的凈值差異明顯
組合相對HS300指數(shù)的超額收益凈值曲線相對平穩(wěn),最大回撤發(fā)生在2014年12月,最大回撤為9%,而在此之前,超額收益的最大回撤為5%左右。從月超額收益上看,組合的月勝率超過50%,達(dá)到了56%,整體效果良好。
而對比弱勢組合的超額收益,多空策略的凈值波動更大,主要的回撤同樣發(fā)生在2014年底,但策略的勝率仍保持50%以上,達(dá)到58%。
組合,算法,分類,凈值,Adaboost








衡水市|
卢氏县|
临安市|
军事|
左权县|
天气|
石首市|
资兴市|
三江|
临沭县|
如东县|
自治县|
六安市|
琼海市|
固原市|
修水县|
梁山县|
南开区|
洱源县|
新疆|
阳新县|
大邑县|
多伦县|
景谷|
上林县|
阿拉尔市|
汉阴县|
余干县|
惠来县|
乐东|
仙游县|
石渠县|
云阳县|
普兰店市|
密云县|
禹州市|
邛崃市|
小金县|
焉耆|
洛阳市|
剑川县|