2024生成式人工智能(GenAI)在生物医药大健康行业应用进展报告.pdf
《2024生成式人工智能(GenAI)在生物医药大健康行业应用进展报告.pdf》由会员分享,可在线阅读,更多相关《2024生成式人工智能(GenAI)在生物医药大健康行业应用进展报告.pdf(67页珍藏版)》请在咨信网上搜索。
1、生成式人工智能(GenAI)在生物医药大健康行业应用进展报告生成式人工智能(GenAI)在生物医药大健康行业应用进展报告CMAC医学事务生成式AI联盟理特咨询天士力数智中药创新中心南京柯基数据科技有限公司2024年4月前言前言自2022年底起,OpenAI推出的ChatGPT在全球掀起了热潮。生成式人工智(GenAI)技术日新月异,各行各业正积极探索如何整合最新的GenAI技术以推动数字化转型。据统计,全球大型企业中,已有10%成功将GenAI技术应用于公司层面的平台级项目,50%正在进行小规模尝试,而另外40%仍在观望阶段。生物医药大健康行业作为一个高度专业化和知识密集型的领域。从药物研发到
2、临床试验,再到上市后的学术推广和患者教育等全流程应用场景,涉及到大量非结构化文本、图片和视频的处理。随着集采政策的实施和监管要求的提高,运营成本和复杂性不断上升,因此迫切需要借助人工智能来提升效率,重塑工作模式。自GenAI推出以来,国内外的药械、营养保健、医疗机构以及科研机构纷纷尝试将GenAI技术应用于不同场景,已经有一些公司和机构通过GenAI创造了全新的产品和服务,为业务增值。最近的一项调查显示,GenAI已成为大多数制药公司的首要关注点,40%的高管表示他们正计划将GenAI带来的成本节约重新投入到2024年的预算计划中。另外,60%的公司确立了使用GenAI来帮助企业降低成本或提高
3、生产效率的目标,其中75%的公司将其视为高管层和董事会的优先事项。2023年4月,CMAC牵头与跨国和国内生物制药企业、医药AI领先企业以及医学专家共同发布了ChatGPT背景下的医疗健康行业数字化转型新范式研究报告,引起了业界广泛关注。该报告结合行业实践和实际需求,从ChatGPT技术原理、技术发展、医疗健康行业国内外应用和研究进展,以及ChatGPT大模型在医药场景测试等角度,提出了ChatGPT大模型在医疗健康行业落地的挑战及可能的路径,为在ChatGPT背景下大模型如何赋能医疗健康行业数字化转型提供参考。在过去的一年中,CMAC医学事务生成式AI联盟与数十家跨国和国内的药械企业、营养保
4、健企业、医院、医疗科研机构等展开了深入合作。通过研讨会、咨询、概念验证(POC)、项目申报等形式,我们交流并见证了GenAI在国内生物医药大健康行业的快速发展和面临的挑战,积累了来自第一线的资料和GenAI应用落地的经验和方法论。我们相信,2024年将是GenAI在中国生物医药大健康行业中实现规模化落地的关键一 年。因此CMAC医学事务生成式AI联盟牵头,联合理特咨询、天士力数智中药创新中心、柯基数据以及生物医药大健康行业专家和GenAI技术专家,更新发布了本报告。报告着重介绍了最新GenAI技术发展和进展,生物医药大健康行业的应用场景和案例,落地挑战及方法论,以及未来展望。我们希望该报告能为
5、GenAI在整个生物医药大健康行业的应用落地提供有益参考。12第一章 GenAI技术进展概述GenAI 应用进展情况第一章 GenAI技术进展概述GenAI 应用进展情况 GenAI技术定义及背景 GenAI应用领域与案例GenAI应用关键技术GenAI应用关键技术模型训练微调RAG提示词工程LangChainAI AgentGenAI大模型发展现状LangChainAI AgentGenAI大模型发展现状国外大模型国内大模型第二章 GenAI在生物医药大健康行业主要应用场景总览GenAI在生物医药大健康行业主要应用场景总览药物研发第二章 GenAI在生物医药大健康行业主要应用场景总览GenA
6、I在生物医药大健康行业主要应用场景总览药物研发靶点发现与验证分子生成中医药研发临床研究临床研究监管合规临床试验中心筛选药物选择、患者入组临床研究方案设计和试验报告生成药物警戒(PV)上市及商业化上市及商业化 学术推广 患者教育临床疾病诊疗临床疾病诊疗诊前诊中诊后 中医诊疗现状总结第三章 GenAI在生物医药大健康行业的挑战、展望及落地建议面临挑战现状总结第三章 GenAI在生物医药大健康行业的挑战、展望及落地建议面临挑战数据合规性、符合医学逻辑及循证溯源监管合规性数据安全性及私有化部署场景选择和成本内部利益的协同未来展望落地建议未来展望落地建议捕捉变化,动态调整顶层设计,数智思维目标锚定,小步
7、快走能力构建,组织提质合作共行,优势互补4445889101316171818253233343436414444454546474848505050515254575859606060606061626262636464第一章:GenAI技术进展概述第一章:GenAI技术进展概述3Source:Arthur D.LittleFigure 1.GEMRIX 2023 findings生成式人工智能(GenAI)在生物医药大健康行业应用进展报告1.1 GenAI 应用进展情况1.1 GenAI 应用进展情况当OpenAI在2022年11月30日发布ChatGPT的时候,没有人会意识到,新一代人工
8、智能浪潮将在接下来短短数月给人类社会带来一场眩晕式的变革。自2010年代初深度学习问世以来,人工智能进入到第三次高潮。而2017年Transformer算法将深度学习推向了大模型时代。OpenAI基于Transformer的Decoder部分建立起来了GPT家族。ChatGPT一经面世便风靡全球,人们惊讶于其能够进行连贯、有深度对话的同时,也惊异地发现了它涌现了推理、思维链等体现智能的能力。伴随AI预训练大模型持续发展,生成式人工智能(GenAI)算法不断创新以及多模态AI日益主流化,以ChatGPT为代表的GenAI技术加速成为AI领域的最新发展方向,推动AI迎来下一个大发展、大繁荣的时代,
9、将对经济社会发展产生重大的影响。1.1.1 GenAI技术定义及背景1.1.1 GenAI技术定义及背景GenAI(Generative AI,生成式人工智能)指的是通过人工智能技术自动生成内容的生产方式。通过训练模型来生成新的、与训练数据相似的内容。与传统类型的AI主要关注识别和预测现有数据的模式不同,GenAI着重于创造新的、有创意的数据,其关键原理在于学习和理解数据的分布,进而生成具有相似特征的新数据,在文本、图像、音频、视频等多种领域都有广泛的应用。GenAI目前最引人注目的应用当属ChatGPT。ChatGPT是基于OpenAI公司的大语言模型GPT-3.5训练、调试、优化的聊天机器
10、人应用,同一个AI模型可以处理各种各样的文字和推理任务。ChatGPT发布仅两个月即获得1亿月活用户,超越了历史上所有互联网消费者应用软件的用户增长速度。以大语言模型、图像生成模型为代表的GenAI技术,成为新一代人工智能的平台型技术,助力不同行业实现价值跃升。GenAI大爆发的背后,普遍认为三个领域的AI技术的发展为其提供了肥沃的土壤,分别是生成算法、预训练模型和多模态技术。第一,随着各种生成算法的不断创新突破,AI现在已经可以生成文字、代码、图像、语音、视频物体等各种类型的内容和数据。GenAI与过去最显著的区别是从分析式 AI(Analytical AI)发展为生成式AI(Generat
11、ive AI)。分析式AI模型是根据已有数据进行分析、判断、预测,最典型的应用之一是内容智能推荐;生成式AI模型则是学习已有数据后进行演绎、生成创造全新内容。第二,预训练模型,特别是以ChatGPT为代表的大模型,引发了GenAI技术能力的质变。在过去,研究人员需要针对每一个类型的任务单独训练AI模型,训练好的模型只能从事特定任务,不具有通用性。而预训练的大模型技术显著提升了GenAI模型的通用化能力4和工业化水平,让GenAI模型成为自动化内容生产的“工厂”和“流水线”。GenAI模型,包括ChatGPT、GPT-4等大语言模型(Large Language Models,LLM)和Midj
12、ourney、Stable Diffusion等图像生成模型,又被称为基础模型(Foundation Models),其作为基于种类丰富的海量数据预训练的深度学习算法,展现出强大的、更加泛化的语言理解和内容生成能力。以大语言模型(LLM)为例,经过海量的互联网内容数据的训练,大语言模型的参数可以达到万亿甚至百万亿级别。这大大增强了语言模型的生成能力,同一个大语言模型可以高质量地完成各种各样的文字和推理任务,例如作诗、写文章、讲故事、写代码、提供专业知识等等。因此,大语言模型已经成为了各大企业竞相追逐的AI方向。第三,多模态AI技术的发展。多模态技术让GenAI模型可以跨模态地去生成各种类型的内
13、容,比如把文字转化为图片、视频(Sora)等等,进一步增强了GenAI模型的通用能力。1.1.2 GenAI应用领域与案例1.1.2 GenAI应用领域与案例(1)多模态内容生成(1)多模态内容生成A.文本生成领域A.文本生成领域自然语言生成是一种GenAI技术,可以生成逼真的自然语言文本。生成式AI可以编写文章、故事、诗歌等,为作家和内容创作者提供新的创作方式。同时,它还可以用于智能对话系统,提高用户与AI的交流体验。ChatGPT(全名:ChatGenerative Pre-trained Transformer对话生成式预训练变换模型)是由OpenAI开发的一个人工 智能聊天机器人程序,
14、于2022年11月推出。该程序使用基于GPT-3.5架构的大语言模型并通过强化学习进行训练。ChatGPT 目前仍以文字方式互动,可以解决包括自动文本生成、自动问答、自动摘要等在内的多种任务。Jasper已经开始为谷歌、脸书等知名公司提供文案GenAI的商业服务。B.图像生成领域B.图像生成领域图像生成是GenAI技术中最为普遍的应用之一。Stability AI发布了稳定扩散(Stable Diffusion)模型,通过开源快速迭代大幅降低了AI绘画的技术使用门槛,消费者可以通过订阅旗下产品DreamStudio来输入文本提示词生成绘画作品,产品已经吸引全球 50多个国家超过100万的用户注
15、册。生成式人工智能(GenAI)在生物医药大健康行业应用进展报告5C.音视频创作与生成C.音视频创作与生成2024年2月16日,OpenAI继一年前发布ChatGPT语言大模型之后,又发布了一款基于人工智能技术的视频生成工具Sora,再次引发轰动。这是一款输入文本即可自动生成高质量视频的文生视频大模型,实现了视频生成领域革命性变革,提供了全新的视觉体验。在部分样片中,Sora还展现了对“物理规律”超强的学习能力,如能够模拟现实环境中的重力、碰撞等物理现象,可以通过直播视频功能实时传递信息,用于直播秀、在线教育、远程医疗等场合。在“现实已经不存在”的惊呼声 中,Sora确实打开了人类视频创作的新
16、天空,它将重塑视觉内容生成的未来,同时也反映出人工智能技术远超预期的快速进步。有媒体称,Sora 不仅仅是一个工具,更是一种新的生活方式,将会对整个社会产生重要影响。GenAI技术还可以用于语音合成,即生成逼真的语音。例如,通过学习人类的语音特 征,生成式模型可以生成逼真的语音,从而用于虚拟助手、语音翻译等应用。GenAI技术可以用于生成音乐。生成式AI可以根据给定的风格和旋律创作新的音乐作品,为音乐家提供新的创作灵感。这种技术还可以帮助音乐家更有效地探索音乐风格和元素的组合。这些曲目可以用于音乐创作、广告音乐等应用。D.电影与游戏D.电影与游戏GenAI可以用于生成虚拟角色、场景和动画,为电
17、影和游戏制作带来更多的创意可能。此外,AI还可以根据用户的喜好和行为生成个性化的故事情节和游戏体验。2023年3月,腾讯AI Lab在GDC上提出了3D虚拟场景自动生成解决方案,能够帮助游戏开发者以更低成本创造风格多样、贴近现实的虚拟城市,提升3D虚拟场景的生产效率。其中重点分享了城市布局生成、建筑外观生成和室内映射生成三大能力。整个路网生成和微调过程仅需要不到30分钟,相比手动设计效率提升近100倍;而单个独特建筑的制作时间也降低至17.5分钟,大大提升了场景制作的效率。E.代码生成领域E.代码生成领域经过自然语言和数十亿行代码的训练。部分GenAI模型精通十几种语言,包括Python、Ja
18、vaScript、Go、Perl、PHP、Ruby等等。能够根据自然语言的指令生成相应的代码。GitHub Copilot是一个GitHub和OpenAI合作产生的AI代码生成工具,可根据命名或者正在编辑的代码上下文为开发者提供代码建议。官方介绍其已经接受了来自GitHub 上公开可用存储库的数十亿行代码的训练,支持大多数编程语言。生成式人工智能(GenAI)在生物医药大健康行业应用进展报告6(2)翻译(2)翻译GenAI可以直接应用于翻译实践之中,与传统机器翻译系统采用以句子为单位的方式训练不同,大语言模型采用以单词为单位的方式进行训练。这使得大语言模型可以理解并再现单词之间的连贯性和上下文
19、信息,译文因而更加自然、准确。此外,传统机器翻译系统在遇到较为复杂的语言环境时,往往会出现句法和语义方面的错误,而大语言模型可以应付更为复杂的语言环境,产出更为准确、自然的译文。相比较而言,大语言模型在翻译方面展现的性能要比传统机器翻译更加突出,能够产出可与人工翻译译文相媲美的翻译作品。(3)内容理解与分析(3)内容理解与分析腾讯会议AI小助手:只需通过简单自然的会议指令,基于对会议内容的理解,就可以完成信息提取、内容分析、会管会控等多种复杂任务。会后可以自动生成智能总结摘要,还能基于智能录制的能力,帮助用户高效回顾,提升用户开会和信息流转效率。生成式人工智能(GenAI)在生物医药大健康行业
20、应用进展报告(4)科研与创新(AI for Science)(4)科研与创新(AI for Science)GenAI可以在化学、生物学、物理学等领域探索新的理论和实验方法,帮助科学家发现新的知识。此外,GenAI还可以用于药物设计、材料科学等领域,加速技术创新和发展。71.2 GenAI 应用关键技术1.2 GenAI 应用关键技术在GenAI领域中,有四种关键技术:模型训练(Model Training)、微调(Fine Tuning)、检索增强生成(RAG)和提示词工程(Prompt Engineering)。针对不同的业务目标和场景,选择适当的技术模型方法至关重要。1.模型训练(Mod
21、el Training):1.模型训练(Model Training):需要大量的数据和计算资源来从头构建一个人工智能模型。它具有高度的可定制性和可扩展性,但耗时较长,成本最高。适用于全新的突破性应用,例如训练一套中医诊疗大模型。2.微调(Fine-Tuning):2.微调(Fine-Tuning):专注于将现有模型适应特定任务,提供了定制性和效率之间的平衡。3.检索增强生成(Retrieval-Augmented Generation-RAG):3.检索增强生成(Retrieval-Augmented Generation-RAG):通过整合外部知识库来增强模型,非常适合需要当前或广泛信息的
22、任务,是现阶段企业级知识库以及Chatbot建设较高性价比的主要方法。4.提示工程(Prompt Engineering):4.提示工程(Prompt Engineering):依赖于设计有效的提示来引导预训练模型,需要在提示设计方面的技能,但计算资源需求较低。这种方法不仅具有成本效益,而且非常有效,然而其潜力经常被低估。每种方法在不同应用中都有其优势和限制,取决于数据可及性、计算资源、特定的任务、对最新信息的需求以及所需技能和成本等因素。1.2.1 模型训练1.2.1 模型训练模型训练类似于AI系统开发的基础阶段(例如重新开发一个ChatGPT)。它涉及从零开始构建AI模型的过程,类似于将种
23、子培育成长成一棵大树。这个过程非常重要,因为它奠定了AI的基本能力和智能。主要适用的场景包括:主要适用的场景包括:1.新领域:1.新领域:当涉足现有模型不适用或不足的领域时。例如,开发一种尚未被探索的新型医学诊断AI2.基于独特数据集应用:2.基于独特数据集应用:在数据对特定需求具有独特性的情况下,例如公司使用客户数据来预测购买模式。3.创新和研究:3.创新和研究:非常适合研究和开发,用于测试新理论或模型。模型训练是人工智能发展的基石,提供了无与伦比的定制化和创新潜力。然而,它需要大量数据和GPU计算资源和开发资源,成本很高,并带有固有的风险,因此更适用于需要定制解决方案或在人工智能应用领域开
24、辟新天地的情况。生成式人工智能(GenAI)在生物医药大健康行业应用进展报告8生成式人工智能(GenAI)在生物医药大健康行业应用进展报告91.2.2 微调1.2.2 微调微调类似于磨练技艺娴熟的艺术家,使其在特定类型中表现出色。它涉及对经过预训练的模型进行调整,即对已经从大规模数据集中学到一般模式的模型进行专门任务或数据集方面的进一步提高。这一过程对于将通用人工智能模型适应特殊需求至关重要。例如基于医学文献训练微调成一套更适合回答健康护理相关的问题。微调主要的适用场景包括:微调主要的适用场景包括:1.特定任务应用:1.特定任务应用:适用于需要模型的一般理解与特定需求相匹配的任务,例如使语言模
25、型适应医学术语。2.有限资源:2.有限资源:适用于无法负担完整模型训练所需的大量资源的情况。3.提升模型性能:3.提升模型性能:当您需要提高预训练模型在特定领域准确性时。在 GenAI 中,微调是将通用模型转变为专业模型的艺术。它在效率和性能增强之间取得平衡,非常适合有针对性改进的场景。这种方法最适用于基础扎实但需要特定专业知识的情况。91.2.3 RAG1.2.3 RAG(1)RAG介绍(1)RAG介绍RAG,即检索增强生成(Retrieval-Augmented Generation),是一种结合了信息检索(Retrieval)和文本生成(Generation)的人工智能技术。RAG是Ge
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2024 生成 人工智能 GenAI 生物医药 健康 行业 应用 进展 报告
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【宇***】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【宇***】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。