機器學習應用系列:T2RL,端到端深度強化學習因子挖掘與組合優化框架.pdf
- 上傳者:6*****
- 時間:2026/04/02
- 熱度:52
- 0人點贊
- 舉報
機器學習應用系列:T2RL,端到端深度強化學習因子挖掘與組合優化框架。本文構建了一種“預測與決策相耦合”的兩階段量化選股框架 T2RL(Two-stage Transformer Reinforcement Learning Framework),旨在解決傳統深度學習模 型僅聚焦于收益率預測而難以實現組合全局優化的問題。該框架將 Transformer 模型與強化學習算法有機結合,第一階段通過深度學習挖掘具備 投資信號的因子,第二階段利用強化學習進行動態權重優化,實現從個股預測 到投資組合構建的完整閉環,提升策略的收益能力和風險控制水平。
階段一:深度學習因子挖掘。第一階段構建了融合 Transformer與 Actor-Critic 機制的因子挖掘模型 TFAC。該模型利用 Transformer 的自注意力機制提取量 價時序數據中的深度表征,并通過 AC框架引入方向準確獎勵函數,使模型同 樣注重收益符號的正確性。回測顯示 TFAC因子 RankIC 為 0.1119,多頭組合 年化收益率 33.61%,優于傳統 Transformer 模型,且大多數年份跑贏基準。
階段二:強化學習組合權重優化。第二階段構建了基于 Transformer 的 Soft Actor-Critic 組合優化模型 TFSAC。該模型首先根據 TFAC因子篩選出排名前 N 的股票構成候選池,將動作空間壓縮至可控維度;隨后在連續動作空間中學 習權重分配策略,以對數收益與方差構建獎勵函數,平衡收益與風險。回測顯 示,單日調倉下 T2RL 組合在全 A 范圍內相對萬得全 A 等權年化超額收益率 50.36%,相對因子多頭組合年化超額收益率 31.06%;在 2日及 5日調倉頻率 下,組合年化收益率相對因子多頭組合年化超額收益率分別為 24.68%及 6.03%。不同調倉頻次下策略均能穩定跑贏基準和 TFAC等權組合,且在因子 短期失效的時期,T2RL 仍可跑贏全 A 指數及多頭等權組合。
滬深 300 指數成分股組合:在滬深 300 成分股內,TFAC 因子的 RankIC 為 6.35%,Top10%多頭組合相對滬深 300 年化超額 8.55%。T2RLHS300 組合 在單日調倉下年化收益率 42.64%,相對滬深 300 年化超額收益率 30.87%, 相對因子多頭等權組合超額 20.43%;在 2日及 5日調倉頻率下,組合相對滬 深 300 超額收益分別為 25.74%和 11.91%,且同樣可以跑贏因子多頭等權組 合。分年度看,T2RLHS300 在大多數年份均能跑贏基準和等權組合。
中證 1000指數成分股組合:在中證 1000成分股內,TFAC因子的 RankIC為 9.17%,Top10%多頭組合相對中證 1000年化超額 11.85%。T2RLZZ1000 組 合在單日調倉下相對中證 1000 年化超額收益率 48.19%,相對因子多頭組合 年化超額收益率 32.21%。在 2 日及 5 日調倉頻率下相對中證 1000 年化超額 收益率分別為 42.88%和 27.35%。相對因子多頭等權組合年化超額收益率分別 為 27.47%以及 13.62%。
免責聲明:本文 / 資料由用戶個人上傳,平臺僅提供信息存儲服務,如有侵權請聯系刪除。
- 相關標簽
- 相關專題
- 全部熱門
- 本年熱門
- 本季熱門
- 量化投資-基于機器學習:FOF投資量化策略.pdf 1091 6積分
- 2021獨角獸&準獨角獸案例報告:第四范式.pdf 737 6積分
- 基于機器學習的日內波動率預測.pdf 550 5積分
- 人工智能機器學習戰略計劃.pdf 500 6積分
- 技術因子的智能擇股研究:利用機器學習技術建立智能策略分析框架.pdf 431 6積分
- 決策樹與隨機森林.pptx 351 12積分
- 機器、符號、神經網絡學習與知識發現.pptx 335 10積分
- SDCC2015機器學習在美團用戶畫像中的應用付晴川V2.pptx 293 9積分
- 遠矚咨詢:2022年全球人工智能機器學習細分市場分析.pdf 220 6積分
- 海量Level 2數據因子挖掘系列(六):用逐筆訂單數據改進分鐘頻因子.pdf 206 6積分
- 海量Level 2數據因子挖掘系列(六):用逐筆訂單數據改進分鐘頻因子.pdf 206 6積分
- 金工深度研究:高頻特征參數化,分鐘級可解釋因子挖掘框架.pdf 166 4積分
- 2025年技術雷達:AI推理、機器學習編排與代理型AI工具及平臺研究報告(英文版).pdf 130 6積分
- 高頻因子(十八):收益來源基礎的因子挖掘方法論一——維度匹配因子.pdf 102 6積分
- 市場微觀結構系列(32):深度學習賦能因子挖掘2.0,綜合應用方案.pdf 89 4積分
- Agent專題報告:RD_Agent實測,AI驅動的因子挖掘框架.pdf 80 3積分
- 因子手工作坊系列(5):知情交易的微觀行為特征與因子挖掘.pdf 63 6積分
- 國海金工機器學習系列專題2:高波背景下的信息挖掘與風險優化.pdf 55 3積分
- 機器學習應用系列:T2RL,端到端深度強化學習因子挖掘與組合優化框架.pdf 53 6積分
