股票分析工具-文本FADT選股.pdf
- 上傳者:羅***
- 時間:2022/07/02
- 熱度:345
- 0人點贊
- 舉報
股票分析工具-文本FADT選股。本文對分析師盈利預測及評級調整中的文本數據進行挖掘,構建的 forecast_adj_txt 因子表現較為優秀:從因子視角來看,該因子分十層回測 嚴格單調,多頭端收益顯著,且與傳統的 forecast_adj 因子相關性低;從主 動選股的視角來看,以該因子多頭第一層為基礎池進行進一步股票精選,構 建出的主動量化 FADT 選股組合在回測期 20090123~20220630 內年化收 益達到 44.13%,夏普比率 1.48,年化雙邊換手 16 倍。參數穩健性測試結 果表明,模型受各組參數影響較小,文本因子過擬合程度較低。 盈利預測調整是“催化劑”事件的間接表達,使用機器學習識別相關文本 本文的初衷是找出對股價有重要影響的“催化劑”事件,通過分析師盈利預 測及評級調整等間接的方式可以對“催化劑”事件進行分析,因此我們的目 標轉換為對盈利預測調整的文本進行識別,找出分析師情感偏正向的調整事 件。在構建模型時,輸入特征為分析師研報文本轉換成的詞頻矩陣,預測標 簽為研報發布前后兩天對應個股的超額收益。在樣本外根據模型預測得分構 建 forecast_adj_txt 因子。測試結果表明該因子多頭收益顯著,分層效果嚴 格單調,同時與傳統方法構建的 forecast_adj 因子相關性低。 對各參數進行穩健性測試,模型大概率不存在過度調參導致的過擬合問題 對模型中的各組參數進行穩健性測試,主要討論了以下參數:訓練使用的非 線性模型、研報標題和摘要采用的詞數、樣本內窗口長度、樣本標簽的時間 區間、標簽分類數量等。測試結果表明,文本因子對各組參數均不敏感,不 同參數下 forecast_adj_txt 因子均具有較為穩定的分層效果,多頭端絕對年 化收益在 21%~23%之間,模型大概率不存在人為過度調參導致的過擬合 問題,參數敏感性較低,這可能提示我們分析師盈利預測調整研報文本的情 感識別是信噪比較高且規律不易隨時間改變的場景。
基礎池的構建方式多樣,在基礎池內進行股票精選構建 FADT 選股組合
基礎池的構建方式較為多樣,可以直接以 forecast_adj_txt 多頭第一層為基 礎池;也可以將 forecast_adj_txt 多頭第一層與 SUE_txt 多頭第一層或 forecast_adj 多頭第一層進行合并,使得基礎池收益沒有明顯削弱的同時股 票數量有所擴充。進一步考慮基本面的 ROE、凈利潤、營業收入、經營活 動現金流、市值以及技術面的反轉、換手、尾盤成交占比等因子,我們對基 礎池進行精選,構建每期 25 只股票等權持有的 FADT 選股組合。該組合在 回測期 20090123~20220630 內年化收益 44.13%,夏普比率 1.48,年化 雙邊換手 16 倍,相對中證 500 年化超額約 30%。
免責聲明:本文 / 資料由用戶個人上傳,平臺僅提供信息存儲服務,如有侵權請聯系刪除。
- 相關標簽
- 相關專題
- 全部熱門
- 本年熱門
- 本季熱門
- 股票分析工具專題報告:高頻選股因子分類體系.pdf 1132 6積分
- 股票分析方法:基于股價跳躍模型的因子研究.pdf 919 6積分
- 股票分析專題:再探文本FADT選股.pdf 628 6積分
- 股票分析工具-文本FADT選股.pdf 346 6積分
- 量化研究專題:探索股價動態關聯,捕捉屬性敏感的動量溢出.pdf 279 6積分
- 股票分析方法:基于地理關聯度因子研究.pdf 219 6積分
- 股票分析方法:盈余公告前的已實現測度是否能預測公告后的股票回報?.pdf 154 6積分
- 股票分析工具:因子模型理論與實踐及因子檢驗的實證.pdf 152 6積分
- 股票市場分析-深挖分析師共同覆蓋中的關聯因子.pdf 140 6積分
- {財務管理股票證券}同花順證券行情分析系統使用說明.docx 111 10積分
- 沒有相關內容
- 沒有相關內容
