金工深度研究:大模型+強化學習因子挖掘.pdf
- 上傳者:0******
- 時間:2025/12/05
- 熱度:382
- 0人點贊
- 舉報
金工深度研究:大模型+強化學習因子挖掘。
人工智能 97:大模型+強化學習挖掘量價因子
本文基于大模型+強化學習技術,探索二者結合在因子挖掘場景下的應用潛 力。通過對因子表達式的 Token 化建模,強化學習可在指定環境中以 Token 單元組成動作序列,形成完整的 Alpha 因子表達式;大模型則可借助其金融 領域知識為強化學習去蕪存菁,注入活水,有效提升強化學習因子挖掘的效 果及穩定性。基于該框架產出因子構建滬深 300 指增策略,回測區間 (20201231-20251128)策略年化超額 17.85%,信息比率 1.50;中證 500 指增策略年化超額收益率 9.78%,信息比率 0.67。
強化學習應用于因子挖掘:Token 化序列建模與序列決策
Token 化是強化學習因子挖掘框架的根基。其目標是將任何數學表達式映射 為一個可學習、可生成的離散序列,使強化學習模型能在離散空間中高效操 作。完成 Token 化之后,因子挖掘問題便可以轉化為一個序列決策問題, 即每一步從有限 Token 集中選取一個符號,將其加入表達式序列中,直到 構造完成一個可執行的因子表達式。強化學習正是解決這類問題的標準方 法。其核心思想在于,讓模型在“試錯”中學習如何生成更優質的表達式, 通過獎勵機制不斷向高質量因子空間逼近。
強化學習的因子挖掘短板與大模型的知識注入
在實際進行強化學習因子挖掘時,我們會發現強化學習模型產出的相當一部 分因子存在構造簡單、不合邏輯、符號多余等問題,原因在于強化學習模型 并不具備語義理解能力,難以構造符合邏輯、具備一定經濟學含義的因子, 而這恰恰是大模型的優勢所在。因此在本文框架中,我們嘗試融入大模型的 領域知識,一方面是構造基礎池,即為強化學習模型提供一個“熱身”過程, 可能更容易挖掘出效果更進一步的因子;另一方面是定期注入新因子,剔除 劣質因子,避免強化學習模型陷入局部最優。
大模型+強化學習因子挖掘全流程
在因子挖掘流程中,由基于 MaskablePPO 算法的強化學習模型持續不斷生 成 Token,以實現因子的不斷挖掘。模型交互的環境可稱之為 AlphaPool, 對應特定股票池的 Alpha 因子池。對于模型生成的任意因子,由 AlphaPool 完成評估,例如 IC 計算、是否為之前的失敗緩存因子、能否入池等等,基 于評估結果確定反饋給強化學習模型的獎勵水平。在此之外,開始挖掘前, 大模型可生成一定數量因子作為初始因子池,強化學習后續迭代過程中,大 模型亦會定期注入新因子以替換劣質因子。
強化學習因子挖掘效果較優,大模型增益效果明顯
基于強化學習挖掘出的因子組合在滬深 300 指增策略表現優異,回測區間 內年化超額收益率可達 16.41%;在中證 500 指增策略中表現同樣較好,回 測區間內年化超額收益率達 7.17%。大模型提供初始因子池,同時定期更新 因子池后,回測區間內,對于滬深 300 指增組合,策略年化超額出現明顯 提升,由 16.41%提升至 17.85%,信息比率從 1.28 提升至 1.50;中證 500 指增策略表現類似,年化超額收益率提升由 7.17%提升至 9.78%,信息比 率從 0.48 提升至 0.67。
免責聲明:本文 / 資料由用戶個人上傳,平臺僅提供信息存儲服務,如有侵權請聯系刪除。
- 相關標簽
- 相關專題
- 全部熱門
- 本年熱門
- 本季熱門
- 騰訊研究院:2026豐饒之后:AI Coding 觀察報告.pdf 610 9積分
- 量子位智庫-2026年中國AI應用行業全景圖譜報告.pdf 188 21積分
- 人工智能行業:大模型推理需求井噴,AI基建投資成勝負手.pdf 165 4積分
- 藝恩-計算機行業:全球大模型數據市場白皮書.pdf 119 5積分
- 智譜-2513.HK-深度研究報告:開TAC時代之局,領跑獨立大模型.pdf 118 4積分
- 碩遠咨詢-2026年中國人工智能行業大模型商業化路徑研究報告.pdf 116 4積分
- Anthropic創始人手冊:打造AI原生初創企業(中英雙語版).pdf 116 4積分
- 計算機行業:模型加速迭代并迎來資本化元年,算力通脹全面擴散,應用分化即將到來.pdf 100 3積分
- 計算機行業智能體應用研究系列(二):全球大模型的技術迭代與商業化.pdf 97 5積分
- 智譜-2513.HK-深度報告:國產模型領航者,破曉AGI時代.pdf 96 6積分
- 騰訊研究院:2026豐饒之后:AI Coding 觀察報告.pdf 610 9積分
- 量子位智庫-2026年中國AI應用行業全景圖譜報告.pdf 188 21積分
- 人工智能行業:大模型推理需求井噴,AI基建投資成勝負手.pdf 165 4積分
- 藝恩-計算機行業:全球大模型數據市場白皮書.pdf 119 5積分
- 智譜-2513.HK-深度研究報告:開TAC時代之局,領跑獨立大模型.pdf 118 4積分
- 碩遠咨詢-2026年中國人工智能行業大模型商業化路徑研究報告.pdf 116 4積分
- Anthropic創始人手冊:打造AI原生初創企業(中英雙語版).pdf 116 4積分
- 計算機行業:模型加速迭代并迎來資本化元年,算力通脹全面擴散,應用分化即將到來.pdf 100 3積分
- 計算機行業智能體應用研究系列(二):全球大模型的技術迭代與商業化.pdf 97 5積分
- 智譜-2513.HK-深度報告:國產模型領航者,破曉AGI時代.pdf 96 6積分
- 騰訊研究院:2026豐饒之后:AI Coding 觀察報告.pdf 610 9積分
- 量子位智庫-2026年中國AI應用行業全景圖譜報告.pdf 188 21積分
- 人工智能行業:大模型推理需求井噴,AI基建投資成勝負手.pdf 165 4積分
- 藝恩-計算機行業:全球大模型數據市場白皮書.pdf 119 5積分
- 智譜-2513.HK-深度研究報告:開TAC時代之局,領跑獨立大模型.pdf 118 4積分
- 碩遠咨詢-2026年中國人工智能行業大模型商業化路徑研究報告.pdf 116 4積分
- Anthropic創始人手冊:打造AI原生初創企業(中英雙語版).pdf 116 4積分
- 計算機行業:模型加速迭代并迎來資本化元年,算力通脹全面擴散,應用分化即將到來.pdf 100 3積分
- 計算機行業智能體應用研究系列(二):全球大模型的技術迭代與商業化.pdf 97 5積分
- 智譜-2513.HK-深度報告:國產模型領航者,破曉AGI時代.pdf 96 6積分
