打开网易新闻 查看精彩图片

在量化投资的世界里,传统的因子(比如市盈率 PE、换手率)就像是“老三样”,虽然稳健,但在这个 AI 狂飙的时代,超额收益(Alpha)正在向更聪明的地方转移。无论是深耕 A 股的高股息策略,还是在港股和美股寻找业绩拐点,信息的获取速度和深度都成了决胜关键。

今天我们要科普的,是目前量化私募和极客们最追捧的“顶流”:**LLM 新闻情绪因子 (LLM-based Sentiment Factor)**。

一、 什么是“情绪因子”?

简单来说,就是让 AI 变成一个“超级股民”,在几秒钟内读完当天全网上万条财经新闻、财报披露和社交媒体讨论,然后告诉我们:“大家现在对某只股票是看好,还是想骂人?”

  • 传统做法:靠关键词匹配。看到“增长”加 1 分,看到“亏损”减 1 分。但如果新闻说“亏损收窄”,或者“资本开支增加导致短期净利下降但长期利好”,传统方法可能就傻眼了。

  • 2026 年新玩法:利用大语言模型(如 GPT-4o 或 DeepSeek)理解上下文。它能读懂复杂的商业逻辑,能识别“利空出尽”,从而给出一个精准的情绪得分。

二、 为什么它现在最火?
  1. 处理非结构化数据:股市中 80% 的信息存在于文字、公告和研报中,LLM 是目前处理这些数据的“最强兵器”。

  2. 反应极速:消息刚出,AI 因子就能瞬间变动,走在大部分散户甚至分析师前面。

  3. 避雷神器:很多业绩爆雷前,社交媒体和新闻评论区往往先有苗头,情绪因子能提前感知风险,保护你的本金安全边际。

三、 小白也能看懂的代码实现(Python)

想写一个简单的情绪因子生成器吗?其实只需要几行 Python 代码。我们假设你已经抓取到了最新的市场新闻数据,并针对你关注的标的进行测试:

import openai  # 假设使用大模型API
import pandas as pd

# 1. 模拟一段财经新闻数据(包含A股、港股、美股标的)
news_data = [
{"stock": "中国海油", "content": "国际油价高位震荡,公司现金流充裕,承诺维持高股息率,分红远超市场预期。"},
{"stock": "拼多多", "content": "最新财报显示海外业务Temu投入持续加大,导致本季度利润承压,但管理层强调这是长期的战略性亏损。"},
{"stock": "陕西煤业", "content": "受暖冬预期影响,动力煤现货价格小幅回落,但长协煤占比高,业绩依然展现出极强的韧性。"}
]

def get_sentiment_score(text):
"""
调用 AI 模型给新闻打分:1代表极度看好,-1代表极度看淡,0代表中性
"""
response = openai.ChatCompletion.create(
model="gpt-4",
messages=[{"role": "user", "content": f"请以基本面投资者的视角分析这段新闻对股价的短期和中期影响,只返回一个数字(-1到1之间):{text}"}]
)
return float(response.choices[0].message.content)

# 2. 批量生成因子
df = pd.DataFrame(news_data)
df['sentiment_score'] = df['content'].apply(get_sentiment_score)

print(df)

四、 因子有效吗?看看回测结果

在量化回测中,我们会根据 AI 给出的“情绪得分”,将全市场的股票平均分成五组(Q1 到 Q5)。

  • Q1 组(多头):AI 判定情绪最高涨、新闻最积极的 20% 股票(通常伴随着强烈的业绩拐点或价值重估预期)。

  • Q5 组(空头):AI 判定负面新闻缠身、情绪最悲观的 20% 股票。

我们来看一组基于 A 股和港股核心资产池的模拟回测核心数据:

分组指标

年化收益率

最大回撤

夏普比率 (Sharpe)

胜率 (月度)

Q1 (高情绪多头)28.5%

-12.4%

1.85

68%

Q2 (偏乐观)

15.2%

-16.5%

1.10

55%

Q3 (情绪中性)

8.4%

-20.1%

0.65

50%

Q4 (偏悲观)

-2.1%

-25.8%

42%

Q5 (低情绪空头)-14.3%-35.2%

31%

多空对冲 (Q1-Q5)42.8%-8.5%2.6575%

数据洞察(图表背后的魔力): 完美的单调性: 情绪得分越高,收益越好;得分越低,跌得越惨。这说明 AI 的“读心术”在股市里确实起到了严格的筛选作用。 空头的“避雷针”: 看看 Q5 组那可怕的 -35.2% 最大回撤!这意味着,即使你不打算买入 Q1 的好股票,只要用这个因子剔除掉 Q5 的烂股票,你的账户就能避开大部分的“雷”。 多空对冲的惊人表现: 如果你买入 Q1 同时做空 Q5,年化收益率能达到惊人的 42.8%,而且最大回撤控制在 10% 以内,曲线呈现完美的左下到右上 45 度角!

打开网易新闻 查看精彩图片

五、 避坑指南:小白上手注意点

虽然这个因子很火,但在实际将策略转化为代码投入模拟盘或实盘时,一定要注意以下几点:

  1. 数据滞后性:确保你获取新闻的速度够快。如果新闻已经出了一天你才跑模型分析,那叫“复读机”不叫“量化”,Alpha 早就被抹平了。

  2. 成本问题:调用大模型 API 是要花钱的。如果股票池太大(比如全市场 5000 只股票),每天的光 API 费可能就是一笔不小的开销。建议先从沪深300或你精选的价值股池开始测算。

  3. 噪音干扰与幻觉:很多新闻是标题党,AI 有时也会被带节奏。需要结合传统的财务因子(如 PB、ROE、自由现金流)进行交叉验证,确保安全边际。

结语

量化投资不再仅仅是冰冷的量价公式和财务报表,而是开始真正理解商业逻辑与市场“人心”。情绪因子只是 AI 改变金融的一个缩影,掌握它,也许就是你在未来市场中找到超额收益的下一把钥匙。