【金融大模型观察】黄艾舟：未来发展方向是通用模型+Agent

财联社12月9日讯（研究员张玉虹记者郭松峤） ChatGPT发布一周年之际，AI大模型的讨论热潮仍旧方兴未艾。在ChatGPT的推动下，国内的大模型企业亦从探索和尝试渐进深水区。

在国内“百模大战”中，有关垂直行业的专有大模型的应用，一直被高度关注。其中，金融领域中的大模型应用便是焦点之一。

那么，目前金融大模型业态发展如何？哪些金融大模型企业可以在“百模大战”中胜出？

毕马威中国金融科技主管合伙人黄艾舟在接受财联社专访时认为，算法以及数据的质量和规模是竞争核心。“金融大模型未来发展方向是通用模型+Agent（智能体）的形式”。

财联社：中央金融工作会议提出科技金融、绿色金融、普惠金融、养老金融、数字金融五篇大文章。在你看来，金融大模型可以给予哪些助力？

黄艾舟：大模型是偏基础设施的一个东西，所以对这五个方面都有助力。现在通常说的金融大模型是通用大模型基础上针对金融行业所做的特色定制，所以叫做“金融大模型”。金融大模型在绿色金融、普惠金融、养老金融这三个领域有一些比较清晰应用了。比如绿色金融方面，AI做ESG数据采集分析。

科技金融更多的是指金融如何更好地为高科技、高成长型公司服务。从这个角度来讲，金融机构为科创公司提供融资服务时，可以用到大模型提升智能风控的效果。数字金融更多的是面向金融机构的数字化。科技金融、绿色金融、普惠金融、养老金融是金融机构怎么服务不同的场景和客群，数字金融是金融机构怎么提升自己的数字化，在这一点上，大模型有很大的应用空间。原来可能有很多现有的AI应用都是比较独立的，客户营销、智能风控、舆情管理、合规管理等等，大模型能像一个底座，把这些个体的AI应用打通。

总结一下，首先如果针对这“五大金融”来说，底座是数字金融，是金融机构的数字化转型，或者是数字能力的提升。大模型在数字能力提升上肯定能发挥巨大的作用，由于底座的质量提升反过来也能更好地促进科技金融、绿色金融、普惠金融、养老金融的发展。

财联社：金融大模型与其他行业大模型相比，具有什么特征？

黄艾舟：大模型需要大量的数据，底层有很多语料训练才能涌现出推理能力。金融业是对于数据安全和数据隐私保护最为重视的一个行业之一，所以开展大模型的探索，可能会存在一定的困难。

目前各银行对于大模型的应用都还在探索阶段。未来大模型在金融机构的应用，我认为有两种方式：一种方式是现有的开源大模型作为底座，利用已经训练好的开源模型，辅以自己的语料进行新的标注和训练；第二种是探索开发自有大模型。我判断这种可能很难，虽然基础技术框架大家都知道，但算力成本太高了。目前来看，想真正完成自有的大模型还是挺费时费力的，而且效果也不一定理想，所以还是第一种方式相对来说比较可靠一些。

财联社：目前国内金融大模型主要的应用情况和落地场景有哪些？主要参与方有哪些？

黄艾舟：金融大模型主要的应用情况和落地场景有三类：一类是做投顾指导。大模型可以代替人的很大一部分工作，生成千人千面的有针对性的投资参考；第二类是做更精准的智能风控。风控方面大模型可以精准地识别市场的信号，提出一些风控建议；第三类是做监管合规。针对监管规定、合规等问题，大模型能够很有效地组织整理信息。参与方分三类：科技公司、金融机构、包括高校实验室在内的技术研究机构。这些应用产品是科技公司在开源大模型的基础上进一步开发完成的。金融机构更多的是采购科技公司提供的方案，也有一些探索是设计一些Agent用大模型来解决自己的研发能力的问题。高校等研究机构在做自己的开源模型。

财联社：你认为金融这个细分领域的大模型展现了哪些比较突出的价值？

黄艾舟：第一是能力更强。金融大模型在具备专业知识的基础上具备了推理能力，能够在特定的领域表现得适应性更高。比如现在有些客服电话，聊一两句就知道它是AI，大部分情况下很难解决具体问题，现在有了大模型，这种沟通解决问题的能力更强了。第二是效率大幅提高。在大模型出来之前，金融机构也一直通过RPA（机器人）提高效率。但我发现具体的业务人员对RPA的使用并不很广泛，因为使用起来还是相对麻烦，有学习成本。而未来金融大模型很可能能够清楚地以自然语言交互的方式理解你说话的意思并且执行相应工作。同时，大模型应用在代码撰写等系统开发领域也是能起到很大作用，大大提升效率。第三是应用场景更加广泛，覆盖更多的用户需求。

财联社：目前金融大模型竞争中，竞争的核心是什么？

黄艾舟：我觉得最关键的是两个能力：第一个核心是算法。原理基础是一样的，但是好的算法能够使得需要的参数减少，同时产生更好的效果，但这需要顶尖的AI科学家。第二个核心是数据的质量和数据的规模。数据质量的意思是有大量的，经过了很好标注的数据，那一定会提升模型的性能和模型产生的结果。标注本身也不是简单的标注，是带着自己对场景、客户和业务的理解去做标注。数据的规模方面，因为大模型的涌现是靠大量的学习不断地训练，数据太少肯定是不行的。国外现在有个方向是在通用的大模型基础上，有各种各样的小公司小团队去做Agent。也就是通用模型+Agent的模式。ChatGPT做的Markets，其实就是类似这种模式。你需要解决的问题，通用大模型可以给到一个看起来及格的答案，但是你又觉得不够解渴，没有真正解决你的实际问题，所以就需要有专门Agent来解决具体问题。比如说金融行业现在已经有100个AI应用，很可能最后这100个AI变成了100个基于大模型的Agent，某个Agent负责解决理财产品销售的问题，另外一个Agent负责解决某个产品的风控问题等等。