新闻 发表于 2025-10-17 12:33

谁是更懂投资的AI?全网首发测评:支小宝、AI涨乐、问财、妙想

作者:微信文章
让AI像投资顾问一样搜索、分析数据,指导投资,到底靠谱吗?

最近马斯克转发了一篇来自字节和哥大商学院的分析报告,发现让大模型搞金融,连查个股价都有可能出错。



例如在查询历史复杂任务数据时,表现最好的Grok 4 (web)准确率只有68.9%,国内最优质的大模型豆包也仅仅只有54.3%。



大模型在一些静态文本任务(比如苹果CEO是谁)上得分很高,但是切换到跨时间、多数据源、因果推理的任务上时(比如过去10年标普500单月最大跌幅是哪个月),就心有余而力不足。

仅依靠大模型来辅助理财投资,还需要结合知识库、金融检索、专业逻辑、智能调度的复合型系统。

而国内支小宝、华泰证券涨乐、东方财富妙想、同花顺问财无一不是宣称智能化布局,推出了综合了大模型、金融知识库、具备逻辑推理能力的智能体。东方财富更是据说投入了千人的产研团队、高举高打。他们的表现如何?它真的懂投资吗?可以放心把自己的钱交给它们吗?

趁着假期没出去玩,我按照普通投资者真正"用得上"的方式来做了一波测试。

●    ●    ●

测评原则

什么叫「用得上」?结合投资者常用问题、监管要求、金融投资的特点,我总结了三个很严格的原则。

1 【结果可靠、过程可溯】

使用的数据来源合法、可验证(如公开财报、监管机构数据、市场公开数据),投资推理结果可靠、过程可溯,提供的不仅是结论,还要说明推理过程,避免“黑箱”,保证用户和监管都能理解决策依据。

2 【适当性匹配】

AI投资助理的所有产品和业务推荐,都必须严格限定在与投资者风险等级相匹配的产品范围内。如果我被标记为保守型投资者,AI就不能主要推荐高风险的产品和业务交易。

3 【有投资洞察】

AI投资助理不能是简单的“智能搜索+数据复读机”,避免“人人都知道”的空话套话,它对投资没有太大的参考意义。需要具备一定的投资洞察能力,比如能识别趋势、挖掘隐含逻辑、提出有价值的观点。

这个要求其实很苛刻,因为就算是专业的投资顾问,也都不一定能提供有洞见、有价值的建议。但是如果没有这个要求,那它和普通的“信息整理工具”其实没有太大区别。比如市面上任何一个AI工具,都能回答“美联储加息时间表”,但只有有洞见的AI,才能进一步回答:它对哪个板块的最有实质性利好影响?本次加息跟以往不同所在、风险在哪里。这才是从工具到“投资助手”的升级。

下面就是我的完整测评,想省时间的可以拉到底看总结。

●    ●    ●

测评过程



1、查询类问题

按照递进式难度,参考字节和哥大商学院的研究方法,我设计了三类任务:

(1)简单历史查询类任务:简单历史查询任务,比如“2024年泡泡玛特公司的营业收入”,需要对齐时间、数据单位等。

(2)时效性任务:需要获取实时变化的数据,如最新股票价格、基金净值、外汇汇率等,它强调数据时效性搜索、多信息源的综合判断。

(3)最具挑战性的是复杂查询任务:比如“过去10年沪深300指数的最大跌幅是哪个月”这样的问题,需要跨越长时间跨度查询、并进行标准化单位比较。“怎么打新创业板股票”需要跨知识库查询打新条件、创业板股票的开通条件,并进行多步推理还不出错。







2.适当性问题




按照递进式难度,我设计了两类任务:

(1)简单推荐类问题:需要结合用户的风险偏好等个人标签、市场环境,推荐具体品种。

(2)复杂推荐类问题问题:除风险偏好和市场环境外,还需要考虑多类资产之间的相关性和和配置比例。





3、分析类问题

按照递进式难度,我设计了三类任务:

1、总结分析类任务:帮助投资者快速理解市场“发生了什么、为什么”,需要具备信息筛选、总结归纳、对照和解释能力。

2、预测类问题:帮助投资者理解“可能会怎样”,需要基于数据和逻辑,通过概率或者场景,说明“未来可能会怎样,以及为什么”。

3、复杂分析类任务:需要把总结和预测转化为可执行的投资启发。





●    ●    ●

测评总结

⭕对于用户来说

目前任何AI投资助理的上限还不够高,如果是比较复杂的任务,但几乎没有任何一款能满足你的需求。

(1)如果你是一个专业的投资者:对比之下,同花顺问财、东方财富妙想还不错。

同花顺的数据覆盖度广,在公司财报、经济数据分析、投资业务办理的准确度比较高,且具备相对专业的投资框架。

东方财富具备深度思考的能力,选股和大模型深度融合,能形成深度投研报告,高于其他平台“信息归纳总结”能力。

(2)对于在对于刚入门的普通投资者:支小宝的体验会更加友好。表达讲人话、理解起来更简单,并且能跟持仓个性标签绑定、提供的投资建议明确且能实际落地。更重要的是,已经能把AI智能化能力全面覆盖到支付宝理财模块的各个场景,陪伴能力能强。

⭕对于平台来说,海内外券商加快AI智能化布局,其实是两条路。

(1)拼组织力:不仅是挂一个或者买一个AI模型、增加一些知识库,还需要把它做到组织系统里,真正投人、投资源,提高数据治理清洗能力、打通数据(内外部)、拆解流程(投顾、决策、风控系统),构建能跑起来的组织环境。

(2)拼服务力:不只是做一个个孤立的AI助手,而是嵌入实际投资操作流程中(市场监控、客户行为分析、账户诊断等),做好服务设计、信任构建和用户教育。比如直接和投资者的持仓结合,比如“你持有的科技ETF和交易习惯,近期受益于政策催化,建议xxx”。
页: [1]
查看完整版本: 谁是更懂投资的AI?全网首发测评:支小宝、AI涨乐、问财、妙想