阿里云:全域数据“观”(2023).pdf
《阿里云:全域数据“观”(2023).pdf》由会员分享,可在线阅读,更多相关《阿里云:全域数据“观”(2023).pdf(64页珍藏版)》请在咨信网上搜索。
1、封面页(此页面将由下图全覆盖,此为编辑稿中的示意,将在终稿 PDF 版中做更新)专家力荐 过去几年,阿里云、瓴羊等平台和企业,致力于将阿里十数年沉淀的数字化经验,帮助企业尤其是金融机构,通过数据智能落地,探索业务的不断增长。今天,这些经验和思考集结成册,相信无论对金融行业,还是每一个力求数字化的企业,都是极好的经验交流的机会。信息(数据)只有流动起来,才能发挥出最大的价值。数据的未来,就是我们的未来。阿里巴巴集团副总裁、瓴羊 CEO 朋新宇 在过去的二十年,我们看到一个越来越明显的趋势,数据要素正在转化成为金融企业新的“资产”,在风险防范、客户服务、产品推广等领域发挥着不可或缺的作用,助推金融
2、企业的业务发展。但是数据并不会自发地转化为资产,业界的成功经验表明,这背后需要建设一套完整的数据体系,并且需要有体系化的建设方法,否则企业会深受数据质量差、底数不清、数据更新不及时、数据口径不一致等问题的困扰。该文基于阿里云多年服务金融行业的成功经验,针对金融企业在数据领域可能遭遇的挑战,从多个维度阐述了数据体系的建设,并且总结了一套完整的数据体系建设方法,对于金融企业而言有很强的借鉴意义。阿里云智能副总裁、行业解决方案研发部总经理 曾震宇 一个看似稳定的行业会在什么时候迎来重大的业态改变?可能是新的生产要素出现以及配合新要素的生产工具也出现新发展的时候,这个转变恰好刚刚开始。数据作为新要素获
3、得社会级的支持是近两年的事情,从数据要素统一大市场到数据资产记账规则再到“数据二十条”的发布,我们看到的是国家为新要素发展做出的基础性改变,但企业是否已经真的意识到了新要素的重要性?是否为此准备好了新工具?是否为新工具调适了新组织?可能大部分企业尚未做好这样的准备,也在思考要不要做、要怎么做。阿里云既经历了阿里自身的新要素建设,也观察了多个行业的新要素探索,本次阿里云将经验与思考合盘托出,是一次对数据要素发展的“盘评治享”,相信企业会在此找到同行者。北京天润聚粮咨询执行董事总经理、中国计算机学会软件工程专委会委员 付晓岩 目录 引言.5 一、金融行业数据领域面临的困扰.7 1.数据平台逐渐“掉
4、队”.7 2.数据治理面临“熵增”困境.8 3.数据资产面临“兵多、精兵少”.9 4.数据服务“效率低”.9 二、金融数据发展瓶颈的破题之术.11 1.转换顶层设计思维.11 2.锚定业务价值目标.13 3.破除数据供需壁垒.14 4.严控数据高质提效.15 5.融合算力数智驱动.16 6.强化数字人才能力.17 三、金融数据能力建设的核心观点.19 1.以全局视角的驱动力.19 2.以分层视角的核心力.23 3.以业务视角的价值链.48 四、金融数据能力建设的成功要素.57 1.关键能力和价值方向.57 2.关键路径和成功要素.58 尾声.64 引言 5 引言 “大风起于青萍之末,浪成于微澜
5、之间。”用这句话来形容中国金融行业数据领域发展的历程颇为恰当。从 2003 年银行的数据仓库开始建设到今天整整 20 年过去了,相比其他行业,金融行业是真正完整地经历了数据仓库建设和大数据建设的两个十年周期;同时经历了从 MPP 技术到 Hadoop 大数据开源技术,再到存储计算分离的云原生数据处理技术;再到 AI 数据智能化的时代;从持续了 20 年的数据治理到今天全域数据资产管理的数据中台化架构,关于金融行业的数据计算分析和智能化运营的探索从来没有停止过。但是如何在原有的数据基础和平台技术积累上完成全局视角的数据能力提升和技术体系的迭代,这是今天金融行业共同关注的话题,也是金融机构进入数字
6、化智能时代的重要标志。阿里云历时五年助力阿里巴巴集团完成了全域数据中台的建设,同时也服务了众多不同类型的金融行业客户在数据平台的建设和数据治理;数据智能化方面,在接触了近千家金融机构了解实际业务需求和现状后,激发了我们创造本文的热情与初衷,期望用更全面、更立体的视角去定义数据的技术和业务价值;站在全局视角去剖析数据生命周期的管理;站在云原生技术的视角去审视数据计算能力的未来布局。同时全文解析了从底层数据计算到数据资产化的完整建设方法和路径,分析了当前数据平台如何从分而治之的建设模式和技术体系逐步演进到全局的数据智能化中台。关于数据领域研究,不仅仅是单纯的技术命题,我们也讨论了金融机构内部数据运
7、营模式以及数据人才建设体系这些当前重要话题。期待本文能够为金融机构不同部门在治理/应用/运营/计算/决策等诸多数据方面的工作,带来有价值的新发现,带来更多关于数据思想的碰撞。本文共分为四个章节,全面围绕当前金融机构在经历近 20 年的数据建设中,依然面临的效率、质量、服务、人才等方面问题,核心从业务对数据的痛点入手,通过能力体系建设方法,助力金融机构掌握数据能力体系的建设目标、方法和成功要素,从而推动金融机构逐步实现数据驱动业务发展的目标:第一章从金融行业数据领域面临的问题出发,重点描述当前金融机构在经历近20年的数据领域建设后,仍然面临数据底数摸不清、数据治理差、数据服务低效、数据资源不足和
8、响应慢的问题,而这些都是我们面对不同金融机构、不同层级的客户提 引言 6 出的痛点和困惑。我们综合了相关问题,通过部分示例列举的方式给出了相关的判断。第二章结合第一章分析的数据体系、数据质量、数据资产、数据服务等领域面临的困惑,提出采用全局思维,以业务价值为终极目标,分析数据领域问题,再进行分层分步推进的总体策略。同时,为了便于读者理解,引出数据建设的 6 大断言,涵盖了数据能力体系顶层设计、业务价值、数据服务、数据治理、数据平台、数字人才相关领域的建设方向,希望为读者带来启发和帮助。第三章从建设方法入手,给出金融行业未来数据能力建设的核心观点,首先从全局视角规划企业数据能力体系的“1”张数据
9、战略蓝图、“3+1”数据体系以及“6”大核心能力,并对其中的数据体系提出了算力驱动、数据驱动和价值驱动的 3 大驱动力;其次用分层思维,深化“3+1”数据体系设计,提出了数字基建 5 大法则、数字资产 8 项能力、数字应用 3 个要素、运营保障 1 套机制的核心能力;最后站在金融机构的“前中后台”不同部门的视角,以获客营销、产品定价、风险审计、数据治理、技术架构等 5 个领域为例,分析数据体系为企业数字化经营带来的价值。第四章结合第三章的数据体系建设方法,本章以目标为导向,开篇提出金融行业数据体系建设的 5 个价值方向,目的是为了让读者了解未来建设数据体系的成效目标。然后围绕数据体系化建设、数
10、据模型合理选择、数仓建设模式、数据服务协同、数据资产运营、数据确信机制等方面给出相应的策略分析,帮助金融机构结合自身现状和现有成果进行选择,满足自身发展需求的建设路径和方法,或者是整体重构,也或者是升级优化。此外也建议金融机构在实施路径上,既要有战略层面的全局设计,也要能小步快跑,满足现阶段业务发展需求。合理的选择实施策略和制定短中长期建设目标,将成功助力金融机构数字化转型。一、金融行业数据领域面临的困扰 7 一、金融行业数据领域面临的困扰 真正的竞争力,是把所有人都可能拥有的东西变成财富,让沙子变成硅,这才是核心。王坚在线 数据是战略资源。如何高效获取更多有用有价值的数据?如何让数据赋能业务
11、创新?如何保持指标口径一致,让监管数据更加准确?如何让更多的业务人员懂数据,又如何让更多的普通人会使用数据?这些问题都是当前各金融机构在数据领域建设中普遍面临的困扰。1.数据平台逐渐“掉队”“哪里的数字化程度高,用户就往哪里迁徙。”数字化程度一个重要标志就是,“数据与业务的关系”是否能从“跟随”(事后分析)、走到“伴随”(实时分析)、再走到“引领”(智能服务)。数据平台能力越强大,将会越快步入数字化程度更高的阶段。金融数据是大数据商业应用最早的数据源。早在 1996 年摩根大通银行就聘请数学家丹尼尔利用递归决策树统计方法,对抵押贷款用户进行统计分析,帮助银行找到可能提前还款或者未来不会还款的客
12、户。国内金融机构以国有大行为代表,从建设数据仓库至今已有近20年的时间,大数据技术从商业产品到开源产品“百花齐放”,一、金融行业数据领域面临的困扰 8 数据大集中推动了企业级数据平台的形成与发展,在发展的过程中,金融机构形成了一套相对完整的数据技术体系和管理体系,支撑了以监管报送、统计分析、业务决策为代表的应用场景,取得了一定的成果。但同时,业务发展对数据井喷式的需求,金融服务粒度正在从“大”到“小”到“微”,数据平台对业务起到“实时精准制导”作用,原有的数据架构逐渐显得“力不从心”。数据需求和海量数据的激增使数据平台资源规模的爆发式增加,大型金融机构节点规模达到数百甚至上千台,大规模集群的稳
13、定性与数据容灾等问题凸显;面对异构数据的集成,差异化的数据格式分析,如何满足多样化应用的数据服务需求存在挑战。如,海量数据查询难以高质高效;多源数据统一存储管理,需要非常简单的融合分析能力;源系统数据变更频繁,需要自动识别和管理;全量建仓或者直连分析对源库压力较大,卸载压力规避故障,建仓延时长,需要低延时入湖;海量数据在事务库或者传统数仓中存在成本高,面临降本压力等等。过去 5 年金融机构的数据总量增长了 3 倍多,实时数据、触点数据、过程数据、流数据、音视频(非结构化)数据等数据价值不断被挖掘,未来业务对数据规模、数据类型、数据应用需求会更进一步放大,现有的数据架构开始出现“掉队”情况。2.
14、数据治理面临“熵增”困境 数据天然面临着“熵增”(模型、指标、数据量)问题,需要一个“都江堰工程”,持续治理、持续做减法。金融行业是最早具有数据管理意识、最早开始建设数据治理体系的行业。虽然经过十几年数据标准建设,但金融机构中的数据仍然很难实现统一和规范,管理决策中数据普遍存在“同义不同名、同名不同义”的局面。例如,银行在监管报送和内部管理两个场景都使用“涉农贷款”这一指标,但是因为口径不同计算的结果肯定不同。监管报送中“涉农贷款”的口径只统计“涉及用于农业、林、牧、副、渔业所属活动或支农活动的贷款”,而内部管理的指标还要包含新农村建设、集体经济发展、民俗旅游等维度,因此出现“同名不同口径”的
15、现象。这类同名指标虽有标准定义,但计算加工过程因没有管控,导致不同部门应用指标时会产生差错。造成数据标准“只有定义、没有落地”的一个非常核心的问题在于,数据标准的“定义”和“实现”实际是两层皮,标准一旦定义完成,就变成“墙上的画”,没有切实镶嵌和固化到日常的数据生产、加工处理和应用的环节当中去,没能建立全链路数据治理能力,有效地从数据生产源头加以强制约束,确保数据质量。一、金融行业数据领域面临的困扰 9 据监管公布数据:2021 年度,人民银行及银保监会向各类金融机构共开出“数据相关”的罚单超过 1000 张,其中与数据质量相关罚单超过 800 张,占罚单总量的近80%,位列处罚事由榜首。所有
16、超千万大额罚单均与数据质量相关,数据质量直接影响了金融机构的生存质量,如何提高数据质量,已成为金融机构亟待解决的问题。3.数据资产面临“兵多、精兵少”“数据指标数据资产”。企业往往面临着“指标多、资产少”的困境,报表很多,但能够服务业务,且可复制、可重用的数据资产(精兵)却很少。经过多年的信息化系统建设,一个中等规模的金融企业往往拥有数百个应用系统、多套数据平台、业务数据表数十万张、业务报表少则几百张、多则数千张。面对这样的“海量信息”,业务和技术人员都会存在一种“坐在金山上讨饭吃”而望数兴叹的感觉。数据部门的数据分析师“找数难”:例如数据分析师建立分析模型时会困扰“没人能告诉我全貌数据都包含
17、什么内容,我怎么能知道分析模型需要的数据咱们行是不是都有。”业务部门的数据用户“查数难”:“这个报表数据的内容看起来不对,我怀疑加工过程中有计算逻辑错误,可是科技也不清楚数据的加工链路,不知道错误出现在哪个环节。”科技部门的技术人员“用数难”:例如数据研发人员经常会遇到的困境“在五六个系统当中都有类似的客户信息数据,我用哪份数据去加工报表更合适?”事实上,这些问题的产生根源都在于我们没有对企业的“数据家底”进行全面的梳理和盘点,不同“数据用户”缺乏有效的工具和手段对企业的数据资产进行全面的了解。4.数据服务“效率低”拿破仑说“真理只在大炮射程之内”。同样,“数据价值也只在数据射程(数据服务)之
18、内”。一、金融行业数据领域面临的困扰 10“数据服务响应慢”是大部分金融机构用数部门面临的数据供给能力不足、效率低下的问题。在传统的数据服务模式中,业务部门与数据部门陷入到了“提需求提数未达预期再提需求再提数”无限循环的“莫比乌斯怪圈”中。这种工作模式中存在两个方面的关键问题:一方面是业务人员“懂业务不懂数据”,数据人员“懂数据不懂业务”,互相理解不够,传递层次越多、信息衰减越大。另一方面是数据需求往往靠技术团队逐个响应和满足(技术团队成为瓶颈),缺少统一的自助数据服务、共性数据需求提炼、差异化需求优先级管理等。目前,很多金融机构已经意识到这一点,开始提出“数据产品”、“数据门户”、“数据工厂
19、”的理念来建设“自助化、可配置、可共享”的数据服务。二、金融数据发展瓶颈的破题之术 11 二、金融数据发展瓶颈的破题之术 金融机构当前所面临的问题和挑战,不再是建设大数据的初期从无到有的过程,经过多年的建设,不论从技术、数据、应用各个维度或多或少已经沉淀了一定的数据基础,现阶段已经到了优化数据体系,推动数业融合,释放数据价值的阶段。下面我们分别从顶层设计、业务价值、数据服务、数据治理、数据平台、数字人才6 个维度提出数据建设思路和断言,希望能够给大家带来一些启发和帮助。1.转换顶层设计思维 “未来商业的 DNA 有两个螺旋:一个是网络协作,另一个是数据智能。”智能商业 断言 1:数据体系建设不
20、再只是“科技的事”,“数据战略就是企业战略”。需要一把手站在“上帝视角”,有决心打破一定的传统业务惯性,推动业务、技术、组织来形成的企业级能力。目前数据架构正在从“大数据”走向“快数据”,未来的金融机构都是“数据驱动型”企业,企业级数据架构需要数据覆盖更全,数据质量更高,数据流通更快,数据应用更准,加快数据与业务的深度融合。二、金融数据发展瓶颈的破题之术 12 1)从业务视角 数据应用一定是业务场景与数据技术紧密融合的产物,如何让数据技术快速赋能业务,又如何缩短从业务提出数据需求到变现落地的时间窗口?是必须经过一个场景一个场景地打磨吗?显然不是。科学合理的方案是通过一个数据归集平台和一套高效的
21、数据工具,让每个业务人员都能自主操作、自行分析,推动业务人员既是场景问题的提出者、也是场景方案的创作者。2)从技术视角 金融机构普遍在数据领域已经有了沉淀积累,但需要结合自身现状,形成一套覆盖数据采、建、管、用各个领域的“数据蓝图”。对数据采集而言,核心能力要做到全域数据实时采集,而“建”数据的核心能力是敏捷构建数据基础、数据资产和数据连接的能力,“管”数据的核心是实现全链路数据治理能力,“用”数据则是强调业务场景驱动的高效数据服务能力。此外,随着金融机构数据规模的激增,除了数据融通之外,平台的计算效率、存储成本、数据容灾、资源可扩展、可运维等方面都需要进行打造。3)从组织视角 打破部门墙,让
22、数据团队走向业务团队,并建立跨部门协同机制,这是数据创造价值的一大利器。为此,很多金融机构提出了打破部门墙,培养综合人才的做法。有条件的金融机构纷纷成立了数据管理部门,统领全公司数据能力建设;也有些金融机构成立固定数据领域业务需求团队,对接业务部门,建立业务、科技的数据桥梁,并由此不断沉淀共性的数据需求。在这样的组织形式下,数据部门与业务部门融为一体,建立专职人员组成协同团队,相互了解对方的工作内容和专业术语,数据应用的顺畅度大幅提升,业务部门的抱怨少了,数据部门的价值也就得到了体现。由此可见,数据领域的建设不是单纯的技术建设,而是需要将技术、业务、数据以及组织与人才有机地结合起来,形成一个能
23、力闭环,持续地沉淀数据能力并不断释放数据价值。二、金融数据发展瓶颈的破题之术 13 2.锚定业务价值目标 “数据主义认为,万物皆算法,任何现象或实体的价值就在于其背后的数据与算法,企业运作就是一套数据+算法”。未来简史 断言 2:未来数字企业的核心竞争力在于,能否将业务的最佳实践“固化”为数据产品(数据和算法),形成一套业务实践与数据体系之间“闭环反馈”的“数字化神经系统”。数据体系建设的成功与否,最终是以业务部门创造的业务价值来衡量和检验效果。数据体系一定要围绕着业务应用,以解决业务部门在不同场景中的痛点为根本目标。因此,引导业务部门积极主动参与建设,从各个业务场景出发设计数据应用方案是数据
24、体系创造业务价值的关键因素。以往金融机构的经营运转,特别是影响重大的业务运作极其依赖于人的知识与经验。有大量碎片化、难以结构化存储的知识是以经验的形式留存在一线员工的头脑中,这也造成了金融业务的开展很依赖于人,一些工作环节虽然无数次重复但却无法快速复制,一些关键决策点需要人的参与,无法保证前后多次决策的一致性。例如:银行在进行贷前风险调查中,通常依赖于有经验的信贷经理实地调查。这些信贷经理常年与客户打交道,总结出了一套颇有成效的经验打法,但经验丰富的信贷经理毕竟是少数,大量年轻的信贷员要在老员工的传帮带下经过多年的锤炼才能足够胜任。像这样沉淀在信贷经理头脑中的业务经验,如果可以拆解到多种业务场
25、景中,每个场景又包含了可量化的指标、可规则化的逻辑判断,以及可归纳总结的决策环节,最终再通过数字产品化的方法,为信贷经理提供直观的数据呈现和关键的决策点,信贷调查效率就能大大提升。同样信贷业务,银行在贷后风险识别中,过去是由信贷经理上门查看企业生产运转情况,分析企业经营流水。有经验的信贷经理能从企业的工厂物料堆放,经常往来的供应商清单中看出风险痕迹。而现在,有些技术领先的银行已经在尝试通过 AI 视觉技术对企业生产现场照片和视频进行识别分析,采用 NLP 技术对企业在银行的流水记录进行分析,从而将信贷调查进行数字化、结构化,通过新技术尝试风险识别的智能化,从而辅助信贷人员提升风险判断能力。二、
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 阿里 全域 数据 2023
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【Stan****Shan】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【Stan****Shan】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。