阿里云云原生一体化数仓.pdf
《阿里云云原生一体化数仓.pdf》由会员分享,可在线阅读,更多相关《阿里云云原生一体化数仓.pdf(31页珍藏版)》请在咨信网上搜索。
1、阿里云云原生一体化数仓新一代一站式大数据处理平台云原生一体化数仓发布DataHub数据总线运营看板数据大屏MaxCompute离线数仓服务分析Hologres实时数仓实时计算Flink版OSS/DLF 数据湖在线应用DataWorks 数据综合治理离线实时一体湖仓一体分析服务一体云原生一体化数仓是集阿里云大数据产品MaxCompute、DataWorks、Hologres三种产品能力于一体的一站式大数据处理平台,通过离线实时一体、分析服务一体、湖仓一体和数据综合治理架构实现成本更低,速度更快,性能更好,运维更简单。离线实时一体以MaxCompute和Hologres为核心的从N到1极简架构,提
2、供离线实时一体化海量云数仓服务;MaxCompute和Hologres 10X性能高速原生互访,深度集成;MaxCompute发布EB级海量云数仓的快速查询能力。湖仓一体持续提升易用的湖仓开发体验;新增非结构化数据的湖仓管理能力;广泛支持开源生态对接。分析服务一体数仓实时化、敏捷化、在线化、一体化趋势明显;一个平台上、一份数据实现灵活探索式分析和高并发在线应用查询,同时实现良好的资源隔离和可用性;减少数据割裂,减少数据移动,统一数据服务出口。全链路数据治理 面向业务视角自顶向下进行数仓规范建模;问题驱动的可持续数据治理与企业数据治理成效评估;DataWorks开放平台全新升级。离线实时一体 数
3、仓数据分析的演进方向架构复杂、数据同步难、数据割裂、开发成本高、不敏捷、人才培养难KafkaFlinkSubscriptionArchivingDim Table JoinHiveClickHouseDruidHBaseCassandraDrillPrestoRedisMysqlAPIApplicationsReportsDashboardsResultCachingBatch Processing批处理Batch Acceleration 离线加速Federated Analytics 联邦计算Point Lookups 点查询Realtime Analytics实时计算结果缓存MaxCom
4、pute大数据数仓体系的“纷繁芜杂”从N 到1的离线实时一体海量云数仓架构DataHub数据总线在线应用运营看板数据大屏实时计算Flink版实时写入实时更新流式写入批量写入写入即可见即席查询服务分析极致高并发、亚秒级低延迟Hologres实时数据仓库海量规模、高吞吐、复杂UDF秒到天级别的广谱适用性、低成本MaxComputeEB级数据仓库离线和实时无缝协同,为客户提供全频谱覆盖的一体化云数仓服务MaxCompute+Hologres 离线实时一体化升级发布Hologres向量引擎直读MaxCompute,30%性能提升Hologres原生向量引擎直读MaxCompute,30%-80%性能提
5、升,更少RPC,更少序列化复用Block Cache,避免存储IO开销支持表达式下推异步ORC Reader,异步Prefetch,支持LazyRead,Lazy Decoding数据原生读写每秒百万同步支持百万行/秒MaxCompute与Hologres之间同步数据,简化数据发布、回刷场景Hologres支持跨集群加速访问MaxCompute支持就近访问Hologres支持MaxCompute TransactionTable元数据自动可见Hologres支持MaxCompute元数据批量导入,支持自动发现与刷新支持更多数据类型读写:Array等上线Serverless共享集群(MaxCom
6、pute加速版),无需提前分配CU,按需使用MaxCompute快速查询能力发布以低成本方式对海量数仓实现加速,全链路平衡客户在性能、延迟和成本上的矛盾MaxCompute内置查询加速引擎,离线查询加速到秒级数据通道新增支持流式写入,配合查询加速引擎,可实现近实时可见,有效缩短业务洞察时间JDBC接口新增支持更多主流BI工具观远BI、网易有数BI、Superset、Davinci加速引擎支持多种付费模式后付费支持自动识别加速,无须用户关注预付费支持独享资源组,可稳定加速(Upcoming!)MaxComputeTable自动识别算法SparkStreamingFlinkBinLog运营看板即席
7、查询离线查询StreamingTableTable离线作业StreamTunnel查询加速湖仓一体 数仓数据架构的演进方向对比维度数据湖数据仓库数据建模事后建模Schema-on-read事前建模Schema-on-Write存储类型结构化/半结构化/非结构化结构化/半结构化引擎性能向所有引擎开放各引擎有限优化向特定引擎开放易获得高度优化成本易启动难运维管理难启动易运维管理(甚至免运维管理)数据治理质量低难管理使用质量高易管理使用计算负载AI、探查分析、数据挖掘Batch、交互式、BI和可视化企业级能力灵活性数据湖 VS.数据仓库业务规模总体拥有成本(TCO)特定规模前,数据湖灵活性占优,之后
8、数仓成长性占优客户如何才能同时享受数据湖的灵活性和云数据仓库的成长性?数据湖云数据仓库登月数据仓库和数据湖系统的增长曲线统一元数据视图跨平台高速网络湖仓统一开发平台湖仓统一数据管理与治理湖仓集成共享数据DataWorks统一任务调度数据仓库数据湖智能Cache+查询加速内置存储HologresMaxComputeE-MapReduceData Lake FormationOSSHDFS湖仓智能数据分层 更易用的湖仓开发体验DataWorks发布湖仓一体主页,实现基于异构数据平台的一站式数据开发、管理和治理体验从提交工单开通模式升级为自助开通模式,实现分钟级打通数仓与数据湖 更广泛的生态对接从支
9、持 HDFS 数据湖扩展到支持阿里云 DLF+OSS 数据湖方案,全新支持Delta Lake、Hudi 等主流数据湖格式支持和外部数据源整库级别联邦(RDSUpcoming!)更高的性能全新支持智能 Cache+MaxCompute内置查询加速引擎,使数据湖查询性能提升 10+倍以上 更丰富的数据类型新增非结构化数据的湖仓管理能力。MaxCompute对OSS上非结构化数据进行映射和管理,方便客户灵活的对湖上各种类型数据进行处理、分析和权限管理(Upcoming!)阿里云湖仓一体云数仓2.0升级发布分析服务一体化实时数仓趋势解读数据加工敏捷化数据服务在线化分析服务一体化传统Lambda架构“
10、纷繁芜杂”,数仓建设之痛KafkaFlink维表关联ClickHouseDruid架构复杂数据同步难资源消耗大数据孤岛人才培养难开发成本高不敏捷HBaseRedisReportsDashboardsAPIApplications实时写入传统实时数仓Lambda架构HiveMaxComputeODS数据加工敏捷化状态存储统一:基于Hologres构建实时数据统一状态层,减少数据搬迁公共层加工:Flink+Hologres Binlog,有状态的全链路事件实时驱动开发应用层加工:视图View封装业务逻辑,提供敏捷与开发效率,将灵活性从工程师交还给分析师Holo BinlogHolo Binlog业
11、务数据库MySQL/PGFlinkRDS BinlogFlinkFlink实时风控实时大屏View离线数仓MaxCompute周期数据回刷DWDDWSADS公共层加工应用层加工数据服务在线化在mission-critical应用中扮演关键角色领导驾驶舱实时大屏洞察业务变化 精细化运营 数据分析民主化 实时数仓 实时用户画像 实时个性化推荐 实时风控ToC:提效在线转化ToB:支撑数据决策 高可用 高并发 低延时/低抖动 热升级/扩容 弹性 可观测、可运维 安全、可审计在线化驱动可靠性设计高并发/低延迟行列共存Shard级多副本,高QPS、吞吐线性扩展高QPS非主键点查(行列共存+多副本+引擎优
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 阿里 云云 原生 一体化
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【Stan****Shan】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【Stan****Shan】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。