量化專題報告:StockFormer,基于Transformer的強化學習模型探究.pdf
- 上傳者:0*****
- 時間:2024/07/31
- 熱度:884
- 0人點贊
- 舉報
量化專題報告:StockFormer,基于Transformer的強化學習模型探究。強化學習通過訓練智能體直接輸出投資決策。強化學習是一種機器學習方 法,通過與環境的交互來訓練智能體,使其在不同狀態下采取能夠最大化累積 獎勵的行動。在強化學習中,智能體(Agent)通過與環境的互動不斷學習, 通過獎勵和懲罰來調整其策略,以便在長期內獲得最大回報。在股票市場中, 強化學習可以通過市場狀態的輸入,不斷調整交易策略,最大化長期的投資回 報。強化學習在金融領域中的應用主要在狀態輸入,獎勵函數及優化算法三個 方面進行了創新。
SAC強化學習加入多項改進以避免模型過擬合。在SAC中,價值網絡是一 個雙Q網絡(Double DQN),即使用兩個獨立的Q網絡的同時對目標函數進 行估計,在目標值計算時選擇最小的一個,從而降低 Q 值的高估風險,防止模 型陷入局部最優或者過擬合。此外,SAC 在策略優化過程中引入了熵正則化 項,熵正則化項的引入使得策略在早期階段保持一定的隨機性,避免策略網絡 和價值網絡的學習模式過于重合以陷入局部最優,從而提高整體的策略探索能 力。對于熵正則項,SAC還引入了自適應熵系數α,通過優化熵系數來自動調整 策略的探索程度,使得模型能夠根據當前的訓練情況動態調整探索與開發的平 衡。
StockFormer 模型利用 Transformer 深度學習進行預測并優化交易決策。Siyu Gao 等人在 2023 年 IJCAI 上發表的論文 StockFormer: Learning Hybrid Trading Machines with Predictive Coding 中采用 SAC 強化學習作為 基礎框架,并采用了3個Transformer 模型分別預測市場相關狀態,短期收益 狀態與長期收益狀態作為強化學習的輸入狀態。然后在SAC強化學習中將3個 隱狀態進行合成,在組合狀態空間中優化交易決策。利用滬深 300 成分股做訓 練,取得了優于基線Transformer模型的效果。
深度學習+強化學習較深度學習+組合優化收益彈性更高。我們將 Transformer 模型作為本篇研究中的基模型構建 Transformer 因子的指數增強 組合,再與 Transformer+SAC 強化學習算法形成對照。在 Transformer 模型 中,我們采用日頻行情與20個日頻技術因子作為輸入,預測個股周度收益排序 作為因子,構建的指數增強組合2019年以來在中證1000內年化收益17.2%, 超額收益13.8%,信息比率2.36,表現穩定。在StockFormer模型中,我們替 換獎勵函數為超額收益-跟蹤誤差-交易費用,并修改前3個Transformer模型, 輸出每日交易行為與持倉,策略年化收益 32.7%,超額收益 29.1%,信息比率 2.57,超額收益波動率較大,但主要為上行波動,模型總體好于 Transformer 的指數增強組合。對策略持倉進行風格分析,發現模型對于市場主線識別能力 較強,通過風格擇時帶來一定超額收益。
免責聲明:本文 / 資料由用戶個人上傳,平臺僅提供信息存儲服務,如有侵權請聯系刪除。
- 相關標簽
- 相關專題
- 全部熱門
- 本年熱門
- 本季熱門
- 量化專題報告:港股財務數據處理六問及因子復現手冊.pdf 244 6積分
- 金工深度研究:AI量化的當下與未來.pdf 190 6積分
- 基本面量化系列研究之五:基于波特五力的投資全解析.pdf 174 6積分
- 金工深度研究:高頻特征參數化,分鐘級可解釋因子挖掘框架.pdf 166 4積分
- 智能驅動+多策略協同,國聯量化團隊的進階之道.pdf 133 5積分
- 量化專題報告:“機器學習”選股模型系列研究(一),量價指紋模型的構建與應用初探.pdf 127 4積分
- 固收深度研究:轉債量化手冊,因子投資實踐.pdf 107 4積分
- 高頻因子(十八):收益來源基礎的因子挖掘方法論一——維度匹配因子.pdf 102 6積分
- 私募基金2026年半年度策略和私募行業創新:量化快速擴規模,宏觀產品多策略化.pdf 100 3積分
- 金工深度研究:多維擇時模型的拆解與重構.pdf 97 3積分
- 量化專題報告:港股財務數據處理六問及因子復現手冊.pdf 244 6積分
- 金工深度研究:AI量化的當下與未來.pdf 190 6積分
- 基本面量化系列研究之五:基于波特五力的投資全解析.pdf 174 6積分
- 金工深度研究:高頻特征參數化,分鐘級可解釋因子挖掘框架.pdf 166 4積分
- 智能驅動+多策略協同,國聯量化團隊的進階之道.pdf 133 5積分
- 量化專題報告:“機器學習”選股模型系列研究(一),量價指紋模型的構建與應用初探.pdf 127 4積分
- 固收深度研究:轉債量化手冊,因子投資實踐.pdf 107 4積分
- 高頻因子(十八):收益來源基礎的因子挖掘方法論一——維度匹配因子.pdf 102 6積分
- 私募基金2026年半年度策略和私募行業創新:量化快速擴規模,宏觀產品多策略化.pdf 100 3積分
- 金工深度研究:多維擇時模型的拆解與重構.pdf 97 3積分
- 金工深度研究:高頻特征參數化,分鐘級可解釋因子挖掘框架.pdf 166 4積分
- 固收深度研究:轉債量化手冊,因子投資實踐.pdf 107 4積分
- 私募基金2026年半年度策略和私募行業創新:量化快速擴規模,宏觀產品多策略化.pdf 100 3積分
- 金工深度研究:多維擇時模型的拆解與重構.pdf 97 3積分
- 金工深度研究:基于籌碼分層結構的端到端AI因子.pdf 88 3積分
- Alpha的梯度——天弘基金量化指增配置思路.pdf 83 3積分
- 金融工程指數量化系列:高值偏離修復模型(多位點).pdf 79 4積分
- 全譜系布局與AI賦能:天弘量化指增的“低相關”Alpha之道.pdf 76 3積分
- 量化專題報告:基于資金推動力的“價量張力”因子構建.pdf 73 3積分
- 量化專題報告:“量價淘金”選股因子系列研究(十七),基于訂單聚集現象的高頻量價因子研究.pdf 72 3積分
