金选·核心观点
DeepSeek-V3发布,性能比肩头部模型
12月26日,幻方旗下深度求索(DeepSeek)发布DeepSeek-V3大模型,模型展现出可以媲美海外头部大模型的卓越性能,在MATH 500和AIME 2024这类考察高级数学推理能力、以及Codeforces等考察代码能力的测试集上得分甚至超过其他闭源模型,包括GPT-4o与Claude-3.5-Sonnet。我们也对模型在推理思考与金融文本分析方面的性能进行了评估对比,发现其已有接近OpenAI的o1模型的综合能力,对金融文本的分析结果也与人工判断相符合。
DeepSeek-V3模型架构与训练机制解析
我们对DeepSeek-V3模型的底层机制进行了详细解读,分析其在性能与成本上取得优势的原因。DeepSeek-V3在模型架构与模型训练层面均有创新性的贡献,不仅在DeepSeekMoE架构下引入了无辅助损失均衡的路由策略,还使用多Token预测的机制,提升对训练数据的使用效;还在后训练过程中使用SFT微调+RL训练思维链的方法,增强模型的在推理与非推理数据上的综合能力。
ETF轮动因子跟踪
我们对前期使用GBDT+NN机器学习因子构建的ETF轮动策略进行跟踪测试,发现因子在样本外表现出色:上周IC值达38.90%,多头超额收益率为1.94%。策略的年化超额收益率为12.11%,信息比率为0.69 ,超额最大回撤为17.31%,上周超额收益率0.05%,本月以来超额收益率1.65%,今年以来超额收益率7.22%,近期表现优异。
高频因子跟踪
我们对前期挖掘的高频选股因子进行跟踪测试,发现因子在样本外整体表现出色。就上周表现来看,价格区间因子多头超额收益率0.73%,价量背离因子-0.10%,遗憾规避因子0.27%,斜率凸性因子0.15%。本月以来,价格区间因子多头超额收益率为3.55%,价量背离因子-0.49%,遗憾规避因子-1.16%,斜率凸性因子-1.51%。今年以来高频因子表现整体都比较优秀,价格区间因子多头超额收益率8.80%,价量背离因子2.85%,遗憾规避因子9.24%。斜率凸性因子表现欠佳,多头超额收益率-3.18%。
其中价格区间因子衡量股票在日内不同价格区间成交的活跃程度,能体现出投资者对于股票未来走势的预期。该因子展现出了较强的预测效果,今年以来表现比较稳定。价量背离因子主要衡量股票价格与成交量的相关性,一般而言相关性越低,未来上涨的可能性越高。但该因子近几年表现一直不太稳定,多空净值曲线趋近走平,不过今年超额收益处于历史较高水平。遗憾规避因子通过考察股票当天被投资者卖出后反弹的比例和程度,展现了较好的预测效果。该因子样本外超额收益稳定,表明A股投资者的遗憾规避情绪依然会显著影响股价的预期收益。而斜率凸性因子则从投资者耐心与供求关系弹性的角度出发,刻画订单簿的斜率和凸性对预期收益的影响。
我们将三类高频因子首先等权合成后构建出了高频“金”组合中证1000指数增强策略,该策略年化超额收益率10.37%,超额最大回撤为6.04%。上周录得0.51%的超额收益,本月以来超额收益为2.02%,今年以来超额收益为6.48%。
为考虑进一步增强策略的业绩表现,我们将高频因子与三个比较有效的基本面因子进行等权合成构建出了高频&基本面共振组合中证1000指数增强策略,该策略在样本外超额收益稳定。上周录得1.57%的超额收益,本月以来超额收益为3.34%,今年以来超额收益率为9.01%。截止到上周,该策略的年化超额收益率为14.94%,超额最大回撤为4.52%。
风险提示
以上结果通过历史数据统计、建模和测算完成,在政策、市场环境发生变化时模型存在失效的风险。策略依据一定的假设通过历史数据回测得到,当交易成本提高或其他条件改变时,可能导致策略收益下降甚至出现亏损。
热门跟贴