AIGC加速企业创新实践指南.pdf
《AIGC加速企业创新实践指南.pdf》由会员分享,可在线阅读,更多相关《AIGC加速企业创新实践指南.pdf(29页珍藏版)》请在咨信网上搜索。
1、12在人工智能发展的漫长历程中,如何让机器学会创作一直被视为难以逾越的天堑,“创造力”也因此被视为人类与机器最本质的区别之一。然而,人类的创造力也终将赋予机器创造力,把世界送入智能创作的新时代。采用机器学习的新范式赋能业务不断探索已经播种了几十年,但随着足够的可伸缩算力的就位、海量数据的爆炸,以及机器学习技术的快速进步,各行各业的客户开始对业务进行重塑。最近,智能对话类型的 AIGC 应用引起了广泛的关注,引发了诸多想象。我们正处在一个机器学习被大规模采用的转折点上,我们也相信人工智能将会重塑大量客户体验和应用程序。从机器学习到智能创造,从专业生产内容(PGC,Professional-gen
2、erated Content),用户生产内容(UGC,User-generated Content)到人工智能生成内容(AIGC,AI-generated Content),我们见证了一场深刻的生产力变革,而这份变革也开始影响到我们工作与生活的方方面面,AIGC 也慢慢的演变成了一场技术和艺术碰撞的盛宴,不断释放人类创造力,提高艺术设计领域的数字化创新效率。本白皮书将结合 AIGC 领域最新技术趋势和真实行业客户案例,向所有 AIGC 的决策者,开发者、创业者和使用者展示 AIGC 给各行各业带来的创新与变革,帮助用户更好的理解AIGC 带给企业的价值,以及如何借助亚马逊云科技的产品和服务快速
3、高效地构建差异化的 AIGC 应用,增强企业在 AIGC 时代的敏捷性与竞争力。前言3目 录 篇章一AIGC 介绍与典型行业应用场景介绍篇章二AIGC 技术生态与典型客户需求篇章三亚马逊云科技 AIGC 技术能力与解决方案篇章四AIGC 客户案例分享4810234Gartner 将生成式 AI 列为最有商业前景的人工智能技术之一。根据其发布的 2022 年人工智能技术成熟度曲线,预计生成式 AI 将在 2-5 年内进入生产成熟期,发展潜力与应用空间巨大。2025 年,30%大型组织对外消息将由生成式 AI 生成。2025 年,50%的药物发现与研发将使用生成式 AI。2027 年,30%的制造
4、商将使用生成式 AI 提高产品研发效率。从数字内容生产,到引领产业变革,商业前景,加速产业融合与变革。从字面意思来看,AIGC 是继 PGC,UGC 之后的新型内容创作方式,可以在创意、表现力、迭代、传播、个性化等方面,充分发挥技术优势,打造新的数字内容生成与交互形态。因此,AIGC 的狭义概念是利用人工智能自动生成内容的生产方式。但是AIGC 已经代表了人工智能技术发现的新趋势,过去传统的人工智能偏向于分析能力,即通过分析一组数据,发现其中的规律和模式并用于多种用途,比如应用最为广泛的个性化推荐算法。而现在的人工智能正在生成新的东西,而不是仅仅局限于分析已经存在的东西,从而实现了人工智能从感
5、知理解到生成创造的跃迁。广义的 AIGC 可以看作是像人类一样具备生成创造能力的人工智能技术,即生成式人工智能,它可以基于训练数据和生成算法模型,自主生成创造新的文本、图像、音乐、视频、3D 交互内容(如虚拟人、虚拟物品、虚拟环境等)等各种形式的内容和数据,以及包括开启科学新发现、创造新的价值和意义等。因此,AIGC已经加速成为了人工智能领域的新疆域,推动人工智能迎来下一个时代。AIGC,生成式 AI(Generative AI)与基础模型(Foundation Models)人工智能,可为现实世界的任务制作足够接近人类生成内容的原创内容由大量数据预先训练的基础模型驱动只需微调,即可用于特定领
6、域自定义任务适用于文本摘要、问答、数字艺术创作、代码生成等多种用例降低机器学习模型开发的时间和成本,提升效率,加速创新AIGC(生成式人工智能)是指可生成全新内容的人工智能技术篇章一 AIGC 介绍与典型行业应用场景5AIGC 基础模型的主要使用方式与所有人工智能技术一样,AIGC的能力由机器学习模型提供,这些模型是基于大量数据进行预先训练的,通常被称为基础模型(Foundation Models)。机器学习的最新进展(特别是基于 transformer 的神经网络架构的发明)直接带来这一类模型的爆发式增长,这类模型通常包含数十亿个参数或变量。如今的基础模型,例如大型语言模型 GPT4 或 B
7、LOOM,可以执行跨多个领域的多种任务,例如撰写博客文章、解决算术问题、对话聊天、基于文档回答问题等,由 stability.ai 开发的文生图模型 Stable Diffusion,可以生成创意图片,转换已有图像风格等。尽管预训练基础模型所带来的功能和可能性已足够令人惊叹,而真正让业界兴奋不已的是,这些通用模型也可以被定制化加工,执行专属于其业务领域的特定功能,帮助业务建立差异化竞争优势,与从零开始训练模型相比,仅需使用一小部分数据和计算资源。定制化的基础模型可以带来独有的顾客体验,体现公司的观点、风格和服务,适用于众多消费者行业,如金融银行、旅行和医疗等。例如,一家金融公司如果需要使用所有
8、相关交易自动生成活动日报以供内部流通,它可以使用包括既5训练时长和成本定制化专业程度已有基础模型的提示词工程(Prompt Engineering)不需要定制化模型需要定制化提示词部分针对特定任务优化增加特定的私域训练数据集完整模型架构与大小词汇量文本长度训练数据集不需要低几分钟到几小时中数天,数周到数月不等高模型微调(Fine-tuning)预训练(Pretraining)往报告在内的专有数据来定制模型,以便基础模型了解如何阅读报告和使用哪些数据来生成日报。但是,基础模型也有一些挑战,包括计算成本高和数据偏差等问题。计算成本是基础模型的一个主要挑战。由于这些模型具有数十亿个参数,因此它们需要
9、大量的计算资源才能进行训练和推理。对于中小型企业来说,从 0 到 1 训练自己的基础模型非常困难,而且在推理时也需要多个GPU进行计算,因此运行成本非常高。另一个挑战是数据偏差。由于基础模型是在互联网上的未经筛选数据上进行预训练的,因此这些数据可能包含偏见、仇恨言论等有害信息。即使有人工标注员,也难以检查每个数据点,因此这可能导致基础模型的信任度不高。尽管存在这些挑战,基础模型的发展仍然是一种重要趋势,它可以提高自然语言处理领域的效率和灵活性。将来,我们可能会看到更多的基础模型应用于各种任务和应用程序,从而推动人工智能技术的进一步发展。6AIGC 塑造数字内容生产与交互的新范式伴随数字技术与实
10、体经济的深度融合、互联网企业数字化场景拓展至元宇宙,人类对数字内容的总量和丰富程度的需求不断提高,AIGC 作为当前重要的内容生产方式,已率先在游戏、营销、电商、传媒、影视娱乐等领域取得进展,伴随 AIGC 在各个行业的渗透,AIGC 作为 AI 数字商业的探路者,有望开启下一场数字商业模式的新篇章。生成图片媲美专业画师的精美图片stability.ai,Midjourney,OpenAI,RunwayML,Tiamat 生成文字人机交互、写邮件、写广告、剧本和小说ChatGPT 对话形式人机交互;Copy.ai-广告和营销文案;Jasper.ai-营销推广文案及博客生成音频人工智能作曲&编曲
11、、人工智能音乐生成、人工智能演唱、声音克隆人工智能音乐团队 Amper,人工智能播客 Podcast.ai,灵动音科技,行者人工智能生成视频文字生成视频、视频内容创作、动态面部编辑、画质增强修复Make-A-Video(Meta),Imagen Video(Google),Phenaki(Google),Synthesia,Hour One6按照模态区分,AIGC 又可分为音频生成、文本生成、图像生成、视频生成及图像、视频、文本间的跨模态生成,细分场景众多,其中跨模态生成值得重点关注。AIGC 典型应用场景与行业分布7游戏聊天机器人、游戏原画设计、场景生成、游戏策略生成、BGM 生成、IP 角
12、色生成;广告设计创意辅助、包装设计、服装设计出图、品牌宣传视频生成、营销素材生成、营销文案配图;媒体娱乐视频游戏生成、AI 生成虚拟人头像、自拍图片风格生成、剧本设计、特效制作、影视作品配乐;零售电商风控欺诈检测、商品 3D 模型、虚拟主播、虚拟货场、智能商品详情、商品个性化图案设计;金融领域智能投顾、智能客服、个性化营销文案、产品风险与客户信用评估、行业研究报告生成;医疗健康医学影像分析、健康数据分析、药物研发、个性化治疗医护陪伴、心理治疗;AIGC 主流行业实践与典型应用场景8AIGC 技术生态加速形成与发展,目前整个 AIGC 应用的技术生态大致可以分为三层:分别为基础设施、基础模型和应
13、用程序。AIGC 技术生态:通过运行自己的基础模型管道或者依赖第三方基础模型 API,把 AIGC 基础模型以端到端的方式为客户提供服务和产品,比如炙手可热的人工智能文本生成领域独角兽 Jasper.ai,提供营销文案生成的 SaaS 服务如广告文案、博客、外发邮件等,人工智能绘画软件 Midjourney 等;为 AIGC 应用提供支持的基础模型,可以通过闭源专有 API(如 GPT-3)或开源模型(如 Stable Diffusion),或者提供开源模型托管平台(如 HuggingFace);提供 AIGC 基础模型进行训练和推理所需的算力基础设施(云计算服务商和硬件制造商),如亚马逊云科
14、技,英伟达等;需要注意的是,我们讲的并不是整个市场的生态图,而是一个分析市场的框架,本文在每个类别中都列出了一些知名厂商的例子,但没有囊括目前所有最先进的 AIGC 应用,也没有深入讨论 MLOps 或 LLMOps 工具,因为现在还没有达到完全成熟的标准化,有机会我们会继续讨论。图片来源:A16Z:who-owns-the-generative-ai-platform/AIGC 技术生态篇章二 AIGC 技术生态与典型客户需求8AIGC 技术生态用户端到端应用程序面向最终用户的应用程序,使用专有基础模型示例:Midjourney、Runway闭源基础模型通过 API 公开的大规模预训练模型示
15、例:GPT-3(OpenAI)模型中心共享和托管模型的平台示例:Hugging Face、Replicate开源基础模型发布训练参数权重的模型示例:Stable Diffusion(stability.ai)云平台在云端部署向开发人员开放的基础硬件示例:Amazon Web Services、GCP、Azure、Coreweave计算硬件专为模型训练和推理工作负载优化的加速器芯片示例:GPU(Nvidia)、TPU(Google)应用程序面向最终用户的 B2B 和 B2C 应用程序,没有专有基础模型示例:Jasper、Github Copilot应用程序基础模型基础设施9作为云服务提供商,亚马
16、逊云科技专注于为基础模型开发者和使用者提供全面、可靠、安全的工具与服务,助力AIGC应用开发加速与成本优化。基于此,我们将基础模型生态的主要参与者分为三类:基础模型提供商(Model Provider),使用基础模型调优提供服务的厂商(Model Tuner)和直接使用基础模型厂商(Model Consumer),我们总结的每一类用户的需求和面临的主要挑战如下:算力规模大 性能要求高算力资源数据隐私安全 内容合规 安全合规模型体积大训练难度高训练调参推理延迟大调用成本高托管推理数据规模大数据质量参差不齐数据准备从 0 到 1 构建基础模型技术门槛高,需要大量的金钱和时间成本基础模型提供商(Mo
17、del Providers)需要专有数据进行持续的模型优化工作使用基础模型调优提供服务的厂商(Model Tuners)缺乏定制支持,若使用闭源 API 则无法控制数据直接使用基础模型厂商(Model Consumers)基于开源基础模型如 Stable Diffusion,大语言模型进行fine-tune 以更好适用业务需求直接部署开源基础模型进行推理或者调用闭源基础模型 APIAIGC 应用构建者和使用者的主要需求AIGC 基础模型生态与典型客户需求基础模型产业化所面临的主要技术挑战:10篇章三亚马逊云科技 AIGC 技术能力与解决方案亚马逊云科技 AIGC 技术能力概览20 多年来,人工
18、智能和机器学习一直是亚马逊云科技关注的焦点,可以说,在机器学习领域的发明创新已经深刻在亚马逊云科技的 DNA 里。当前,用户在亚马逊云科技上使用的许多功能都是由其机器学习驱动的,比如电子商务推荐引擎、优化机器人拣选路线、无人机 Prime Air。还有语音助手 Alexa,这也得益于来自 30 多种不同的机器学习系统的支持,每周回应客户数十亿次管理智能家居、购物、获取信息和娱乐的请求。亚马逊有数千名工程师专注于机器学习研究,这既是我们的宝贵资产,也是我们现在最关注的理念和面向未来的实力之所在。在亚马逊云科技,我们致力于不断降低机器学习的使用门槛。截至目前,我们已经帮助超过 10 万家来自各行各
19、业的不同规模的客户使用机器学习进行创新。我们在人工智能和机器学习堆栈的三个层级都拥有至深至广的产品组合。长期以来,通过不断投入、持续创新,我们为机器学习提供高性能、可伸缩的基础设施和极具性价比的机器学习训练和推理;我们研发了 Amazon SageMaker,为所有开发人员构建、训练和部署模型提供最大的便利;我们还推出了大量服务,使客户通过简单的 API 调用就可添加 AI 功能到应用程序中,如图像识别、预测和智能搜索;同样,在 AIGC 技术上,亚马逊云科技也迈出了重要的一步,让这项技术也将赋能千行百业。亚马逊云科技能做的就是,让更多客户能够访问基础模型能力、为机器学习推理和训练提供基础设施
20、、提高所有开发人员的编码效率,帮助我们的客户更简单、更容易地在业务中使用 AIGC。11业务流程优化Amazon PersonalizeAmazon ForecastCanvas无代码机器学习文本Amazon Translate 文本Amazon Titan TextAmazon Titan Embeddings Amazon ComprehendAI21Jurassic-2搜索Amazon KendraJumpstart模型与解决方案库语音Amazon Polly AnthropicClaudestability.aiStable DiffusionMore对话Amazon LexAmazo
21、n Transcribe CallAnalyticsGroundTruth数据标记EDGE MANAGER管理边缘设备 CI/CD|数据治理|负责任的人工智能代码+DEVOPSAmazon CodeGuruAmazon CodeWhisperer视觉Amazon Textract Amazon Rekognition 工业Amazon MonitronAmazon Lookout for Equipment生命健康Amazon HealthLakeAmazon Comprehend Medical专用通用PyTorch,Apache MXNet,TensorFlowAmazon EC2GPUs
22、Amazon InferentiaAmazon TrainiumHabana GaudiFPGACPUs人工智能服务Amazon SageMakerAmazon Bedrock机器学习框架与基础设施数据准备地理信息机器学习Notebook模型开发训练模型参数调优部署至生产管理和监控Studio IDE特征存储Amazon Fraud DetectorAmazon Lookout forMetricsAmazon Lookout for VisionAmazon DevOpsGuruContact LensVoice IDAmazon Transcribe MedicalAmazon Omics
23、Amazon TranscribeAmazon Panorama亚马逊云科技人工智能与机器学习技术栈至广至深的机器学习产品套件111212面向不同的基础模型生态伙伴,亚马逊云科技提供了不同层次的产品与服务帮助用户提升开发效率,主要的产品和服务如下:基础模型提供商构建自己的基础模型Amazon SageMaker基于亚马逊云科技自研Trainium 和 Inferentia芯片的 EC2 实例面向基础模型提供商,使用基础模型调优提供服务的厂商,直接使用基础模型厂商,提供全面深入的产品与服务使用 Amazon SageMaker 基础模型 HubSageMaker JumpStart使用基础模型调
24、优提供服务的厂商基于 Nvidia GPU 的 EC2 实例P4P3G4EC2 P4instancesEC2 G4instancesEC2 P3instancesAmazon CodeWhispererAIGC 解决方案推理调用基础模型提供的 API直接使用基础模型厂商JumpStart 提供的最先进的第三方预训练基础模型Hugging FaceAmazon Bedrock来自亚马逊的自研大语言基础模型来自 AI21 Labs、Anthropic 和 stability.ai 的第三方基础模型Titan TextTitan EmbeddingsJurassic-2ClaudeStable Di
25、ffusion13面向模型提供商提供适用于每种工作负载的高性能、经济高效、可扩展基础设施,尤其是两款基于无论运行、构建还是定制基础模型,客户都需要高性能、低成本且为机器学习专门构建的基础设施。亚马逊云科技提供基于英伟达最新 GPU 芯片(如 H100,A100,A10,T4 等)的虚机实例,满足用户对基础模型训练和微调的算力资源需求。除此之外,过去五年,亚马逊云科技持续加大在自研芯片方面的投入,不断突破性能和价格的极限,以支持对此有极高要求的机器学习训练与推理等工作负载。亚马逊云科技 Trainium 和 Inferentia 芯片可以提供在云上训练模型和运行推理的最低成本。正是因为我们在成本
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- AIGC 加速 企业 创新 实践 指南
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【Stan****Shan】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【Stan****Shan】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。