深度解析:DeepSeek如何成为金融AI领域的佼佼者

深度解析:DeepSeek如何成为金融AI领域的佼佼者

21世纪经济报道记者李览青 上海报道

经过两年多的探索,金融行业大家一致认为,虽然大模型通过海量数据可以快速回答问题,但这并不能完全满足实际业务需求,强调推理能力的“慢思考”同样不可或缺。

去年9月,OpenAI发布的o1模型迅速引发全球AI市场的热潮,主要是因为它通过强化学习和思维链的方式成功将复杂问题拆解,这让大模型的推理能力大大提升,尤其是在解决数学和复杂任务方面,表现远超GPT系列的通用大模型。

不过,o1在推理能力上的提升,是以响应速度和算力消耗为代价的。跟GPT系列那种“秒答”相比,o1的反应速度大约需要10秒,而且使用成本也很高。

春节前不久,DeepSeek推出了DeepSeek-R1推理大模型,并开放了模型权重,成为全球首个成功复现o1能力的模型。它在推理性能上与o1相当,但算力消耗却减少到十分之一。通过官方API接入R1模型的输入token(命中缓存)的价格仅为o1的五十分之一,未命中缓存及输出token的价格大约是o1的二十七分之一。

谈到R1带来的这场技术风暴,一家股份制银行的数字化转型部门高管非常激动地告诉记者:“毫不夸张地说,DeepSeek开发出了国内性价比最高的大模型。”他指出,这里的性价比不仅体现在推理成本的节省上,还有业务应用能力的显著提升。“以往很多申请资金的AI项目,要么因为成本太高,要么落地计划不够实际,最终没能获批,但我相信未来会有很多创新项目不断涌现。”

众多受访者指出,R1模型通过开源实现了“AI平权”,这让更多中小金融机构能够释放出AI应用的潜力,产生更多确定性的应用。然而,要让这个优秀的模型真正投入使用,依然离不开传统通用大模型在应用时的语料训练、算法调优和算力支持。

另一个需要明确的事实是,虽然多家金融机构宣布接入了DeepSeek-V3和R1全尺寸模型,但这并不意味着其他通用模型厂商就被淘汰了。在下一个技术“奇点”出现之前,通用大模型、深度推理大模型、多模态模型以及核心业务场景的小模型仍然会共存,依据不同场景进行应用。

补齐短板:一个“全科211硕士”的诞生

“用户的问题是……”

这是DeepSeek在很多情况下回复用户时的第一句话。当你向DeepSeek提问时,它会经过十几秒的深思熟虑后再给出答案,并在回复中解释自己对问题的理解、涉及的方面,以及用户可能期待的反馈,这就是深度推理大模型的“慢思考”过程。

R1模型的慢思考能力源自DeepSeek的算法创新。与传统大模型的“秒问秒答”不同,R1不会直接给出回答,而是对指令内容进行多次推理,利用思维链、共识和检索来生成最佳答案。由于模型每次生成内容都需要反复推敲,因此也会产生更多的输出标记,从而进一步提升模型质量。

许多受访者认为,R1最大的突破在于弥补了传统通用大模型的推理短板

“总体而言,现在的大模型就像是一位全科211硕士。”一位来自中型券商的信息技术负责人告诉记者,一个完备能力的数字员工,需要同时具备快思考和慢思考的能力,而在R1的帮助下,“慢思考”得以实现。

他承认,在DeepSeek开源R1之前,机构只能接入o1模型的API接口,但由于金融行业的合规和数据安全问题,实际应用中的限制很多。而现在R1的出现可以处理复杂数据,并模拟人类的推理思维,性能与o1相当。

一家城商行的大模型业务负责人也表示:“之前我们接入的都是类似通用大模型,如通义千问、DeepSeek-V3,但始终没有像o1那样的深度推理大模型。R1发布后,AI应用才真正具备了深度思考的能力。”

以智能营销为例,传统通用大模型生成的营销文案,可能只是基于规则系统的整理,或者根据用户指令快速反馈,若面临质疑,可能无法通过多次互动达到预期效果。而基于推理大模型的深度理解,与用户的互动将会更加智能且精准。

算力、数据:通用大模型走过的路一条也不能少

虽然R1模型在推理方面表现优异,但要成为金融行业的一员,它必须经历与传统通用大模型相同的考验。

AI行业权威的Vectara HHEM人工智能幻觉测试显示,DeepSeek-R1的幻觉率为14.3%,远高于DeepSeek旗下的V3模型的3.9%,也超过了行业的平均水平。

“学而不思则罔,思而不学则殆。”这句话在AI领域同样适用。

虽然R1模型在推理能力上表现卓越,但在文科内容输出方面却常常出现幻觉。

一位金融机构的首席信息官告诉记者,他在尝试用DeepSeek生成个人简历时,发现其表述出现了“胡说八道”的现象,而其他通用大模型在整理公开资料时相对准确。

以上提到的城商行人士也坦言,R1模型在逻辑推理方面的表现是国内大模型中最突出的,但在本地化部署金融相关语料数据之前,其专业知识理解仍存在偏差。

“灌进去的知识并不是立刻就能发挥它的逻辑思维能力。”他表示,所有大模型在金融行业的落地,都必须解决算力和数据这两大挑战。

一方面,AI战略下对语料的需求带来的数据治理仍是金融机构必须面对的问题,R1模型更大的幻觉问题对高质量数据集和知识库提出了更高的要求。

另一方面,从算力的角度来看,如果金融机构想要本地部署大模型,其算力消耗包括两方面:一是本地部署时激活所需的算力成本,二是推理过程中消耗的算力成本。前者是固定的开支,具体根据部署模型的尺寸不同而有所差异;而后者则直接影响模型的效果。

不过,与通用大模型相比,R1模型在推理成本和训练成本上都有明显优势,显著降低了落地应用的算力成本。

值得一提的是,虽然多家金融机构都宣布接入DeepSeek-R1或V3相关模型,但各机构由于资源禀赋不同,接入模型的尺寸也有所区别。

例如邮储银行和江苏银行接入的是轻量版DeepSeek-R1模型,而某大行的金融科技部人士告诉记者,该行目前刚刚部署了14B的R1模型,尚在测试阶段。而前述中型券商IT部门则部署了R1的全尺寸模型。

该城商行人士还表示,DeepSeek-R1模型提供7B、14B、32B、671B等不同尺寸供用户选择,用户可以根据个人或企业需求进行部署,小尺寸模型是基于“满血版”671B模型的蒸馏版本,其性能和效果会有所差异。但通义千问旗下的Qwen2.5开源版本最大尺寸只有72B。

这意味着,如果金融机构希望通过本地化部署实现最佳效果,“满血版”R1模型的本地化部署所需的显存远高于Qwen2.5,这或许也是一些机构选择从轻量模型开始试水的原因。

变革已至:释放创新应用想象力

尽管不同金融机构接入DeepSeek的程度各有不同,但对于金融行业而言,R1强大的推理能力无疑将激发创新应用的无限可能,掀起一场AI应用的深度变革。

其实,金融行业与DeepSeek的渊源并不浅。记者了解到,其实早在一年多前,金融机构在尝试部署AI大模型时,就已经接入了DeepSeek-Coder-V2开源代码模型。在接受21世纪经济报道采访的7家金融机构IT部门中,有5家机构的智能代码助手模型都是基于Coder-V2提供服务的。

“我们尝试过市面上大部分代码语言模型,可能因为幻方量化在量化编程方面的能力较强,Coder-V2在代码生成方面的表现更佳。”一位受访者表示。

“DeepSeek通过开源R1模型实现了‘AI平权’。”前述券商人士指出,原本这种推理模型需要深厚的技术背景,如深度学习、神经网络推理、元学习等,但DeepSeek开放的技术报告使得所有机构都可以在自己的大模型上复现构建R1模型所需的强化学习工作流,通过知识蒸馏的方式实现从DeepSeek到金融领域大模型的能力转移,从而在复杂金融场景中提升AI应用的实战效能。

他表示,在证券行业,将会为行业开辟“AI+经纪”、“AI+投研”、“AI+投顾”、“AI+合规”、“AI+文档”等创新模式的新路径。同时,他所在公司计划基于深度推理大模型进一步增强AI诊股、AI涨停分析、行业研究报告生成等功能。

需要注意的是,推理大模型的出现并不意味着通用大模型的消失。现在,通用大模型、推理大模型、多模态模型和小模型在不同的金融业务场景中各司其职。

“对于我们这样将AI作为核心战略的银行而言,DeepSeek将加速创新应用的出现。而对那些因为成本因素而未能大规模实施AI战略的中小金融机构来说,或许会重新构建他们的科技规划。”一位银行数字化转型部门的高管表示,尽管AI在金融核心业务场景的落地实施仍面临挑战,但人工智能的目标并不是代替业务人员做到100%的准确,而是通过AI提供更多金融服务的可能性,在业务中创造更大的创新应用价值。

“如果一家银行的CIO对AI抱有不切实际的期望,或许是不理解智能时代AI的真正价值。”他补充道。

更多内容请下载21财经APP

来源:今日头条
原文标题:深度丨 DeepSeek入局金融AI,一名“理科优等生”的上岗路 – 今日头条
声明:
文章来自网络收集后经过ai改写发布,如不小心侵犯了您的权益,请联系本站删除,给您带来困扰,深表歉意!

《深度解析:DeepSeek如何成为金融AI领域的佼佼者》有6条评论

  1. DeepSeek-R1的推出无疑是金融AI领域的一次创新突破,特别是在推理能力和成本效益上都有显著提升,期待它能带动更多中小金融机构的AI应用。

    回复
  2. DeepSeek-R1确实为金融AI带来了新的机遇,特别是它在推理能力上与o1相当但成本更低,这是很多中小金融机构所期待的。希望未来能看到更多应用落地。

    回复
  3. DeepSeek-R1的推出真是个好消息,不仅提高了推理能力,还大幅降低了成本,让更多金融机构能享受到AI的红利。期待看到它在实际应用中的表现。

    回复
  4. DeepSeek-R1的慢思考能力让人耳目一新,不再是简单的秒答,而是经过深度推理后给出的答案,这对复杂问题的解决非常有帮助。期待它在金融领域的广泛应用!

    回复
  5. DeepSeek-R1的推出标志着金融AI领域的一次重要突破,它不仅提升了推理能力,还显著降低了成本,让更多机构受益。期待未来能有更多创新项目涌现。

    回复
  6. DeepSeek-R1的推出真是好消息,不仅在推理能力上与o1相当,更重要的是降低了使用成本,未来金融AI将会有更多创新应用。

    回复

发表评论