機(jī)器學(xué)習(xí)選股系列研究之二:基于Dask計(jì)算圖的遺傳規(guī)劃高頻因子挖掘框架.pdf
- 上傳者:b**
- 時(shí)間:2026/03/13
- 熱度:84
- 0人點(diǎn)贊
- 舉報(bào)
機(jī)器學(xué)習(xí)選股系列研究之二:基于Dask計(jì)算圖的遺傳規(guī)劃高頻因子挖掘框架。遺傳規(guī)劃(Genetic Programming,GP)是更廣泛的進(jìn)化計(jì)算領(lǐng)域的一個(gè)子 領(lǐng)域,其根源可追溯至遺傳算法(Genetic Algorithm,GA)。然而,與主 要用于優(yōu)化參數(shù)的傳統(tǒng)遺傳算法不同,遺傳規(guī)劃旨在進(jìn)化出算式本身作為 問(wèn)題的解決方案。遺傳規(guī)劃的核心可以概括為“隨機(jī)性”和“方向性”的權(quán) 衡,算法既要保證種群往更好的方向進(jìn)化迭代,又要保證其種群的多樣性與 進(jìn)化的隨機(jī)性,防止陷入局部最優(yōu)解。 為實(shí)現(xiàn)日頻與分鐘頻數(shù)據(jù)混合輸入的高頻因子自動(dòng)化挖掘,本文基于遺傳 規(guī)劃庫(kù) gplearn 與分布式計(jì)算庫(kù) dask 進(jìn)行深度重構(gòu),構(gòu)建了一套高效且硬 件友好的高頻因子挖掘框架。借助 dask 的分布式計(jì)算圖與惰性求值機(jī)制, 分鐘頻數(shù)據(jù)得以分塊存儲(chǔ)、按需加載,在突破內(nèi)存限制的同時(shí),保持了高性 能計(jì)算,為混合頻率因子挖掘提供了堅(jiān)實(shí)的技術(shù)底座。 在框架優(yōu)化方面,通過(guò)將分鐘數(shù)據(jù)封裝為 dask array,使其以分塊形式高 效參與遺傳規(guī)劃迭代;基于 dask 算子對(duì)遺傳規(guī)劃分鐘頻算子進(jìn)行重構(gòu),使 得因子表達(dá)式的執(zhí)行可映射為 dask 計(jì)算圖,進(jìn)而實(shí)現(xiàn)了高效的并行調(diào)度; 此外,通過(guò)擴(kuò)充算子庫(kù)、引入覆蓋度與多樣性控制機(jī)制、設(shè)計(jì)多元化適應(yīng)度 函數(shù),有效提升了挖掘效率與因子多樣性,使算法更聚焦于增量信息的發(fā) 現(xiàn)。 基于上述框架,本文初步挖掘了 10 個(gè)低相關(guān)性的遺傳規(guī)劃因子。單因子 20 日 Rank IC最高達(dá) 8.91%,ICIR 達(dá)5.10,多空組合年化收益率最高為 19.13%, 信息比率達(dá) 2.26。將遺傳規(guī)劃因子與既有因子群等權(quán)合成后,合成因子 20 日 Rank IC 提升至 13.24%,ICIR 為 4.61,多空組合年化收益率達(dá) 38.41%, 信息比率達(dá) 2.40。
免責(zé)聲明:本文 / 資料由用戶個(gè)人上傳,平臺(tái)僅提供信息存儲(chǔ)服務(wù),如有侵權(quán)請(qǐng)聯(lián)系刪除。
- 相關(guān)標(biāo)簽
- 相關(guān)專題
- 全部熱門
- 本年熱門
- 本季熱門
- 量化投資-基于機(jī)器學(xué)習(xí):FOF投資量化策略.pdf 1091 6積分
- 2021獨(dú)角獸&準(zhǔn)獨(dú)角獸案例報(bào)告:第四范式.pdf 737 6積分
- 人工智能機(jī)器學(xué)習(xí)戰(zhàn)略計(jì)劃.pdf 500 6積分
- 人工智能在選股與ETF輪動(dòng)上應(yīng)用.pdf 461 6積分
- 決策樹(shù)與隨機(jī)森林.pptx 351 12積分
- 機(jī)器、符號(hào)、神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)與知識(shí)發(fā)現(xiàn).pptx 335 10積分
- SDCC2015機(jī)器學(xué)習(xí)在美團(tuán)用戶畫(huà)像中的應(yīng)用付晴川V2.pptx 293 9積分
- 金融工程2023年回顧及2024年展望:市場(chǎng)底部特征已明顯,高頻因子低頻化樣本外表現(xiàn)出色.pdf 256 6積分
- 遠(yuǎn)矚咨詢:2022年全球人工智能機(jī)器學(xué)習(xí)細(xì)分市場(chǎng)分析.pdf 220 6積分
- IMF-結(jié)構(gòu)改革與經(jīng)濟(jì)增長(zhǎng):機(jī)器學(xué)習(xí)方法(英).pdf 179 6積分
- 2025年技術(shù)雷達(dá):AI推理、機(jī)器學(xué)習(xí)編排與代理型AI工具及平臺(tái)研究報(bào)告(英文版).pdf 130 6積分
- 量化投資專題報(bào)告:把握爆品脈搏,新消費(fèi)量化洞察與選股.pdf 100 6積分
- 2026年銀行業(yè)板塊投資策略:從業(yè)務(wù)與業(yè)績(jī)角度看穩(wěn)健性;兩條選股主線.pdf 92 6積分
- 高頻選股因子周報(bào):高頻因子走勢(shì)分化,多粒度因子顯著回撤。AI增強(qiáng)組合均大幅度回撤.pdf 89 6積分
- 機(jī)器學(xué)習(xí)選股系列研究之二:基于Dask計(jì)算圖的遺傳規(guī)劃高頻因子挖掘框架.pdf 85 5積分
- 國(guó)海金工機(jī)器學(xué)習(xí)系列專題2:高波背景下的信息挖掘與風(fēng)險(xiǎn)優(yōu)化.pdf 56 3積分
- 因子復(fù)合與選股實(shí)踐——市場(chǎng)微觀結(jié)構(gòu)系列研究(二).pdf 21 4積分
