基于多租户架构的企业GPT构造器的设计及其在5G消息上的应用.pdf
《基于多租户架构的企业GPT构造器的设计及其在5G消息上的应用.pdf》由会员分享,可在线阅读,更多相关《基于多租户架构的企业GPT构造器的设计及其在5G消息上的应用.pdf(3页珍藏版)》请在咨信网上搜索。
1、2 8 0 2 0 2 4年3期2 0 2 4年第4 6卷第3期基于多租户架构的企业G P T构造器的设计及其在5 G消息上的应用李红纲 丁 健作者简介:李红纲(1 9 7 7-),硕士,高级工程师,研究方向为云计算、大语言模型、消息服务、O S S/B S S;丁健(1 9 8 2-),本科,中级工程师,研究方向为云计算、智能计算、大模型运营。(浩鲸云计算科技股份有限公司 南京2 1 0 0 1 2)摘 要 C h a t G P T以其强大的自然语言处理和知识推理技术,在全球范围内引起了大型语言模型(L LM)的热潮。通过基于多租户基础架构的企业G P T构造器,实现了企业网站抓取和文档加
2、载功能,为中小型企业租户提供了私域数据喂养和向量化服务,并将语料向量作为L LM的长期记忆,构建了企业级G P T能力。通过配置的5 G消息C h a t b o t同企业客户进行交互,在交互过程中,其能通过检索向量数据库中的企业相关信息,提供企业级的C h a t G P T服务。关键词:大语言模型;向量数据库;C h a t G P T;企业G P T;多租户;5 G消息;聊天机器人中图分类号 T P 3 1 1.5D e s i g no fM u l t i-t e n a n tB a s e dE n t e r p r i s eG P TB u i l d e ra n dA
3、p p l i c a t i o nf o r5 G M e s s a g eL IH o n g g a n ga n dD I N GJ i a n(W h a l eC l o u dT e c h n o l o g yL t d,N a n j i n g2 1 0 0 1 2,C h i n a)A b s t r a c t W i t hi t sp o w e r f u ln a t u r a l l a n g u a g ep r o c e s s i n ga n dk n o w l e d g er e a s o n i n gc a p a b i l
4、 i t y,C h a t G P Th a sc a u s e dt h ec r a z eo f l a r g e l a n g u a g em o d e l s(L LM)a r o u n d t h ew o r l d.T h r o u g h t h e e n t e r p r i s eG P Tb u i l d e rb a s e do nm u l t i-t e n a n t i n f r a-s t r u c t u r e,i t r e a l i z e s t h e f u n c t i o n so f e n t e r p
5、 r i s ew e b s i t e c r a w l i n ga n dd o c u m e n t l o a d i n g,p r o v i d e sp r i v a t ed o m a i nd a t a f e e-d i n ga n de m b e d d i n gs e r v i c e f o rs m a l l a n dm e d i u m-s i z e de n t e r p r i s et e n a n t s,a n du s e se m b e d d e dv e c t o r sa st h el o n g-t
6、e r mm e m o r yo fL LMt ob u i l de n t e r p r i s e-l e v e lG P Tc a p a b i l i t i e s.T h r o u g ht h ec o n f i g u r e d5 G m e s s a g eC h a t b o t t o i n t e r a c tw i t he n t e r p r i s ec u s t o m e r s,i t c a np r o v i d ee n t e r p r i s e-l e v e lC h a t G P Ts e r v i c
7、e sb yr e t r i e v i n ge n t e r p r i s e-r e l a t e d i n f o r m a t i o ni nt h ev e c t o rd a t a b a s e.K e y w o r d s L a r g eL a n g u a g eM o d e l,V e c t o rd a t a b a s e,C h a t G P T,E n t e r p r i s eG P T,M u l t i-t e n a n t,5 Gm e s s a g e,C h a t b o t0 引言大语言模型(L LM)指使
8、用大量文本数据训练的深度学习模型,其可以生成自然语言文本或理解语言文本的含义。大语言模型具有令人印象深刻的自然语言理解和生成能力,具备生成各种格式和风格的文字回答等能力1。2 0 2 2年1 1月底,O p e n A I发布了C h a t G P T,使其一跃成为A I领域的现象级应用。国内百度、阿里等互联网头部企业和清华大学等科研机构竞相布局A I产业,并推出了“文心一言”“通义千问”“智谱清言”等大语言模型。5 G消息2基于G S MA U n i v e r s a lP r o f i l e业务标准,当前业务部署采用2.4版本3,在消息内容上支持富媒体格式,并引入了新的基于人机交
9、互方式,构建了统一可信的信息服务入口。5 G消息支持与L LM能力平台、企业业务平台等对接集成,企业客户可以通过5 G消息更方便地体验企业L LM服务。1 企业痛点L LM通过5 G消息为企业带来诸多收益,但由于L LM的训练数据集主要来源于互联网数据,如C h a t G P T的训练数据集来 自B o o k s C o r p u s,W e b T e x t,C o mm o nC r a w l,W i k e p e-d i a,G u t e n b e r等4。企业私域信息并未经过L LM训练,当客户查询关于企业的业务信息时,L LM无法进行答复。因此,企业界(尤其是中小型企
10、业)希望能打通企业数据和L LM的互联网数据,构建企业自有G P T,服务企业目标客户。2 引入企业数据的方式企业在使用L LM为自身服务的过程中,可以采用不同的方式,如提示工程(P r o m p tE n g i n e e r i n g)、向量表示(E m-b e d d i n g)和微调(F i n e-T u n i n g)等5。2.1 提示工程(P r o m p tE n g i n e e r i n g)提示工程通常应用自洽提示、知识生成提示、知识整2 0 2 4年3期2 8 1 合提示、控制生成提示、概述提示、情感分析提示等技巧,实现企业想要的特定目标6。其优势是无需
11、开发对接,即开即用。但劣势是利用提示工程加入企业数据的方式,需要在 每 次 交 互 时 作 为O n e-s h o t或F e w-s h o t加 入 会 话背景。2.2 向量表示(E m b e d d i n g)利用L LM的E m b e d d i n gA P I,可以将企业知识转化为向量,并存储到向量存储(V e c t o rS t o r e)中。企业G P T在提供交互服务时,首先会同企业向量数据库中的向量进行语义匹配,然后由L LM根据企业数据对问题作出答复,以达到构建企业G P T服务的目标7。2.3 微调(F i n e-T u n i n g)利用J S ON
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 租户 架构 企业 GPT 构造 设计 及其 消息 应用
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。