2024人工智能大模型技术财务应用蓝皮书.pdf
《2024人工智能大模型技术财务应用蓝皮书.pdf》由会员分享,可在线阅读,更多相关《2024人工智能大模型技术财务应用蓝皮书.pdf(128页珍藏版)》请在咨信网上搜索。
1、3人工智能大模型技术财务应用蓝皮书 前言1.人工智能大模型技术概述1.1 人工智能大模型技术概念解析1.2 人工智能大模型技术典型特征1.2.1 突出的“涌现”能力1.2.2 统一的 Prompt 交互1.2.3 高扩展性的应用框架1.2.4 高成本的训练和推理过程1.3 人工智能大模型技术发展历程及现状1.3.1 预训练语言模型1.3.2 大模型家谱1.3.3 国产大模型1.3.4 财务领域大模型1.4 人工智能大模型技术发展趋势1.4.1 模型架构演进1.4.2 训练方法创新1.4.3 应用场景拓展1.4.4 伦理和安全风险规避1.4.5 大模型发展趋势展望2.人工智能大模型技术体系架构概
2、述 2.1 人工智能大模型技术整体体系架构2.2 人工智能大模型技术分类3.人工智能大模型技术赋能财务概述3.1 人工智能大模型技术赋能财务总体情况(1)人工智能大模型赋能财务发展前景(2)人工智能大模型在财务领域的应用分析3.2 人工智能大模型技术赋能财务基本框架3.3 人工智能大模型技术赋能财务实现路径3.4 人工智能大模型技术赋能财务核心价值788999910111112121314151515161617171922222223252829目 录44.人工智能大模型技术赋能财务应用4.1 人工智能大模型技术赋能家用电器制造行业 A 集团财务应用4.1.1 总体情况(1)需求背景(2)发
3、展现状4.1.2 典型案例(1)案例背景(2)财务中台智能客服项目定位(3)财务中台 GPT 平台框架(4)财务大模型在智能客服场景的落地(5)智能客服建设成果4.1.3 应用场景(1)生成式智能客服(2)非结构化附件的智能审核(3)生成式财务分析(4)生成式管报4.2 人工智能大模型技术赋能 B 公司财务应用4.2.1 总体情况(1)需求背景(2)发展现状4.2.2 典型案例(1)智能财务平台业务架构(2)企业大模型应用架构(3)企业智能助手4.2.3 应用场景(1)智能审单机器人(2)智能交单(3)智能财务制度助手(4)智能财务数据分析助手4.3 人工智能大模型技术赋能 C 银行财务应用
4、4.3.1 总体情况(1)需求背景31313131323333333436373838383940404040414242434547474949515353535人工智能大模型技术财务应用蓝皮书(2)发展现状4.3.2 典型案例(1)建设思路(2)建设框架(3)技术突破4.3.3 应用场景(1)风险评估防控(2)投资组合推荐(3)欺诈行为检测4.4 人工智能大模型技术赋能 D 汽车企业财务应用4.4.1 总体情况(1)需求背景(2)发展现状4.4.2 典型案例4.4.3 应用场景(1)智能采集(2)智能审核(3)智能月结(4)智能风控(5)经营分析4.5 人工智能大模型技术赋能 E 大型基础
5、设施综合服务商财务应用4.5.1 总体情况(1)需求背景(2)发展现状4.5.2 典型案例4.5.3 应用场景(1)智能差旅(2)智能审核(3)智能融资决策4.6 人工智能大模型技术赋能 F 医药行业财务应用4.6.1 总体情况(1)需求背景54545455565757596061616162626464697279858989898990929293959696966(2)发展现状4.6.2 典型案例4.6.3 应用场景(1)合规性监控应用(2)智能财务客服的应用4.7 人工智能大模型技术赋能 G 大学财务应用4.7.1 总体情况(1)需求背景(2)发展现状4.7.2 典型案例(1)模型与知
6、识服务(2)智能财务能力组件(3)财务智能体(AI Agents/数字会计/智能助理)(4)用户场景与应用衔接(5)案例应用效果与前景4.7.3 应用场景(1)智能财务助理(2)智能填报(3)智能稽核4.8 人工智能大模型技术赋能 H 投资集团财务应用4.8.1 总体情况(1)需求背景(2)发展现状4.8.2 典型案例4.8.3 应用场景(1)共享服务与智能问答(2)管理报告与智能分析(3)司库管理与虚假贸易识别(4)决算分析与填报助手(5)工程风险评价与合规管理5.人工智能大模型财务应用局限性和关注问题5.1 人工智能大模型技术财务应用局限性5.2 人工智能大模型技术财务应用关注问题9797
7、99991011031031031031041051061071081081091091111161181181181191191221221231241241251271271277人工智能大模型技术财务应用蓝皮书2023 年 9 月,习近平总书记在黑龙江考察东北全面振兴期间首次提出“新质生产力”这一重要性的概念,并要求“积极培育新能源、新材料、先进制造、电子信息等战略性新兴产业,积极培育未来产业,加快形成新质生产力,增强发展新动能”。人工智能是适应全球经济创新发展的新质态生产力,习近平总书记强调指出:“加快发展新一代人工智能是我们赢得全球科技竞争主动权的重要战略抓手,是推动我国科技跨越发展
8、、产业优化升级、生产力整体跃升的重要战略资源”。财政部、国资委等部委也相继明确指出人工智能等新技术推动财务(会计)数字化转型的重要作用,实现财务管理工作的高质量发展。2022 年横空出世的 ChatGPT 是一个里程碑式的人工智能深度学习系统。人工智能大模型的发展可以追溯到以传统神经网络模型为代表的萌芽阶段,而随着 Google 提出基于 Transformer架构的神经网络模型,奠定了大模型预训练算法架构的基础。2022 年 OpenAI 公司发布的ChatGPT 是通用人机对话系统,是一个大型的语言模型和一款具有较高智能的多语言聊天机器人,在 Transformer 架构基础上,以 GPT
9、(Generative Pre-trained Transformer,生成式预训练语言模型)模型及人类反馈的强化学习(RLHF)进行精调的策略下取得了巨大的成功。虽然真正意义上的人工智能大模型发展历史并不长,但对人类社会的影响产生了积极作用。财务作为服务经济发展的重要组成部分,也将受到人工智能大模型的影响。目前,我国企事业单位已将光学字符识别、自然语言处理、语音识别、机器人流程自动化、专家系统、规则引擎、知识图谱、机器学习、深度学习等人工智能技术应用在会计核算、费用报销、财务报告、战略管理、预算管理、成本管理、营运管理、投融资管理、绩效管理、风险管理、管理会计报告、资金管理、司库管理、税务管
10、理、审计管理等大财务领域。随着人工智能技术创新迭代,大模型将在大财务领域的应用开花结果。基于此,我们编写了人工智能大模型技术财务应用蓝皮书,通过大模型的技术概念、典型特征、技术架构、财务应用基本框架、财务典型案例、财务应用场景等内容,旨在帮助与引领企事业单位财务部门及广大财务人员认识大模型的技术类型与发展趋势,并了解大模型在大财务领域的应用场景,希望能够为需要的人提供启发。前 言1 人工智能大模型技术概述81.1 人工智能大模型技术概念解析人工智能(Artificial Intelligence,简称 AI)是约翰麦卡锡等人在 1956 年达特茅斯会议上首次提出的概念,主要研究和开发能够模拟、
11、延伸和扩展人类智能的理论、方法、技术及应用系统。人工智能领域的研究包括机器人、语音识别、计算机视觉、自然语言处理、专家系统和机器学习等,旨在通过一定的学习和训练,使计算机能够模拟人类感知、认知智能行为,从而完成一定的任务。深度学习(Deep Learning)作为机器学习(Machine Learning)的一个重要分支,基于人工神经网络(ANN)进行建模,通过模拟人脑神经元的连接和工作方式,使计算机能够像人一样学习和理解数据。深度学习技术的核心在于其深度神经网络结构,这些网络通常由多个层次组成,每一层都能够从输入数据中提取出更高级别的特征。随着层次的加深,网络能够学习到越来越复杂和抽象的特征
12、,随着层数加深以及维度加大,逐渐形成大规模参数的模型(广义的大模型),从而实现对数据的更深入理解。机器为了深入理解和有效掌握语言,采用构建语言模型的方法来进行语言的表征和建模。早期的语言模型是通过手工编写的规则和语法结构来解析和生成语言,随着统计学的发展,统计语言模型(Statistical Language Models)开始兴起,基本思想是基于马尔可夫假设构建单词预测模型,例如,基于最近上下文预测下一个单词,为了减少计算,通常上下文取前 n 个词,也被称为 n-gram 语言模型。为了提升语言模型的上下文理解能力,深度学习技术与语言模型进行结合产生了神经网络语言模型(Neural Netw
13、ork Language Models)。早期的神经网络语言模型如循环神经网络(RNN)能够处理序列数据,但存在梯度消失和梯度爆炸问题。长短期记忆网络(LSTM)和门控循环单元(GRU)等变种 RNN 模型通过引入门控机制,解决了 RNN 的梯度问题,能够更好地处理长序列数据。Transformer 模型则采用了自注意力机制,进一步提高了模型对序列中不同位置信息的处理能力,成为了目前最流行的语言模型架构之一。预训练语言模型(Pretrained Language Models,PLMs)是一种通过在大规模语料库上进行无监督预训练的语言建模方法,旨在学习语言的通用表示。模型通过捕捉语言的统计规律
14、和结构信息,为自然语言处理(NLP)任务提供了强大的基础。在预训练完成后,PLMs 可以通过微调(fine-tuning)的方式,针对特定任务如机器翻译、文本分类、情感分析等进行适应性调整,典型代表如 Bert 模型。近年来,随着计算能力的飞速增强和大规模数据训练模型技术的崛起,生成式大语言模型(Large Language Models,LLMs)以 ChatGPT 为代表,开始崭露头角。这些模型通过扩大预训练语言模型的规模和训练数据的范围,能够学习到更加复杂和精细的语言表示,进而展现出令人瞩目的语言生成和理解能力。LLMs 通过海量的文本数据进行训练,深入学习了语言的结构、语义和上下文关系
15、。这使得能够以统一模型处理各种自然语言任务,同时也展现出了强大的泛化能力和涌现出新的深度理解、逻辑推理、遵循指令、代码生成等能力,为解决一系列复杂任务提供了可能。1.人工智能大模型技术概述人工智能大模型技术财务应用蓝皮书91.2 人工智能大模型技术典型特征大模型达到一定规模后,会涌现出传统语言模型以及中小规模预训练语言模型所不具备的特殊能力,使大模型在使用界面、应用开发方式、模型构建过程和工程要求上也有深刻的变化。1.2.1突出的“涌现”能力“涌现”能力是大模型在达到 10 亿参数以上规模后出现的特殊能力,它们在解决复杂任务时表现出显著的优势,使得大模型在自然语言处理(NLP)领域取得了突破性
16、进展,例如数学问题解答、逻辑推理和多步推理等任务,主要体现在:上下文学习(In-context learning):大模型能够通过提供的自然语言指令或者提示语(prompt)中的个别任务示例引导,在没有额外训练和参数更新的情况下,生成与指令或示例相符的期望输出。例如,13B 的 GPT-3 模型在算术计算以及一般任务上都能表现出不错的上下文学习能力,但 GPT-1 和 GPT-2 模型则没有。指令遵循(Instruction following):通过使用自然语言描述的多任务数据集进行指令微调(instruction tuning),大模型能够在未见过的、以指令形式描述的任务上表现出色,有更好
17、的泛化能力。例如,LaMDA-PT模型在大小达到68B时,在未见过的多任务评估基准测试中显著优于未调整的模型,8B 以下模型则不会。逐步推理(Step-by-step reasoning):小型语言模型在解决涉及多步推理的复杂任务(如数学问题)时通常很困难。相比之下,大模型可以使用包含中间推理步骤的思维链(chain-of-thought,CoT)提示机制来得出最终答案。这种能力通过在代码上进行训练而获得,尽管这一点还需进一步研究来验证,而逐步推理能力是使用大模型进行复杂任务规划、流程拆解的基础。1.2.2统一的 Prompt 交互大模型深刻改变了人们使用 AI 算法的方式,与以往 AI 算法
18、的输入输出形态各异相比,大模型提供了统一的提示语(Prompt)交互方式,使得应用调用更为简单,只要掌握了提示语技巧,用户也可以在各种任务中直接使用。统一的Prompt 交互使得基于大模型的应用能够形成统一的“Copilot”型交互界面,便于标准化和形成用户习惯。提示语设计需要考虑任务需求、期望输出以及对模型能力的激发,除了角色、任务和指令定义说明之外,在复杂任务求解中,为了引导大模型进行上下文学习和逐步推理、多路径推理、多答案评估、自我评估、流程拆解和串接等,还有各种更高级的提示语方法,如思维链(Chain of Thought)、思维树(Tree of Thought)、自我一致性(Sel
19、f-Consistency)、反思(Reflection)、专家提示(Expert Prompting)、链(Chains)、轨道(Rails)等,此外,自动提示工程(APE)还可以通过大模型自身来生成提示语、评分和迭代,递归的使用大模型来创建高质量的提示语,提升模型输出质量。1.2.3高扩展性的应用框架大模型除了自身的知识和推理能力外,与外部知识库、信息检索、各种工具 API 等结合,还可以构建具备感知、理解、规划和执行能力的自主智能体(Agent),能够完成更加复杂的任务。大模型在 Agent 中提供理解、规划和生成能力,处于大脑核心位置,外部知识库、检索引擎、工具 API 等构成可定制化
20、的外围组件。1 人工智能大模型技术概述10检索增强生成(Retrieval-Augmented Generation,RAG):RAG 系统结合了信息检索和大模型生成的能力,通过从外部知识源(如搜索引擎或知识图谱)检索相关信息,并将这些信息与输入提示结合,以生成更准确和丰富的回答。RAG 能够扩展大模型的已有知识,并使大模型获得对外部长信息的处理能力。为了更好地利用 RAG,研究者们还开发了RAG-aware 提示技术,如 FLARE(Forward-looking Active Retrieval Augmented Generation)。FLARE 通过迭代的结合预测结果和信息检索,动态
21、地在生成过程中引入最新信息,从而提高回答的准确性和相关性。规划和执行(Plan and Execute,P&E):P&E 是复杂任务多步执行的基本方案,以机器人流程自动化(Robotic process automation,RPA)场景为例,P&E 使用大模型将原任务自动拆解成 RPA 代理可以执行的流程单元,以完成文件报表处理、自动化测试等包含大量重复性步骤的任务。如果规划中有未知步骤依赖于前导步骤的执行结果,那么需要一边执行一边调整规划,这需要大模型和 RPA 代理之间的持续多次交互机制。大模型智能体(LLM-Agent):大模型 Agent 是基于大模型构建的自主实体,可以认为是 RA
22、G、P&E 和外部工具(如APIs)的能力综合,能够感知环境、做出决策并执行任务。大模型通过外部工具来扩展其功能,这些工具可以是信息检索、数据分析、计算等各种类型的服务,例如,通过天气 API,大模型 Agent 可以回答与特定地点的天气相关的问题。大模型可以根据输入、上下文和可用工具做出决策,通常涉及复杂的推理过程,如何用外部知识和已知 API 的能力来解决问题。为了更有效地使用工具,研究者们研发了 Toolformer 训练方法和 Tool-aware 提示技术如 ART(Automatic Multi-step Reasoning and Tool-use),能够教会大模型何时使用工具以
23、及如何设置 API 参数,如何结合思维链来使用工具。ReWOO(Reasoning without Observation)、ReAct(Reason and Act)和 DERA(Dialog-Enabled Resolving Agents)等提示技术,使大模型能够在没有直接观察的情况下推理,生成可执行的步骤,以及在对话中解决问题。综上所述,大模型应用框架涉及提示设计、外部知识整合、工具使用和智能体构建等多个层面,这是一个具有广泛适用性和高度可扩展性的应用框架,不同层面的优化和整合,共同提升了大模型的实用性和智能化水平。1.2.4高成本的训练和推理过程相比小规模的语言模型,大模型巨大的参数
24、量对训练语料的数量和质量都有更高的要求,训练流程更为复杂,训练周期更长,对算力的要求也远高出小规模语言模型。大模型的训练过程包括语料收集和预处理、模型预训练、微调等阶段。语料处理:大模型的能力很大程度上依赖于预训练语料库的规模、质量和预处理方式。预训练语料库包括通用语料和专业语料,前者包括网页、书籍、对话文本等,后者如多语言文本、代码、专业领域的数据和文本等,赋予大模型通用的语言能力和泛化能力,以及专业知识。语料预处理需要去除语料中的噪声(错误、冗余、无关内容如广告、重复内容、格式错误、异常值等)以及隐私、敏感、有害内容,并平衡各类语料的分布以增强模型的多样性,最后是切词处理,将语料转换成可训
25、练的格式。预训练(Pre-Training):预训练之前要确定模型的架构(包括模型基本单元 Transformer 的类型,模型的结构配置如正则化、位置编码、激活函数、注意力和偏置等,模型的规模配置如层数和各层单元数等)、预训练的具体任务(如语言建模、去噪自编码或者混合专家(MOE)等)、训练过程中的优化参数配置(如优化器选择、批量数(Batch)、学习率、训练精度等)、并行训练(如数据并行、流水线并行、张量并行)与加速、稳定性控制等(如定期检查点)。预训练过程可以分成多个阶段,每个阶段在已有检查点的基础上,调整优化参数的配置、预训练语料的构成乃至预训练任务之后进行继续训练。人工智能大模型技术
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2024 人工智能 模型 技术 财务 应用 蓝皮书
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【宇***】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【宇***】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。