中国数据库行业分析报告:向量启航引擎加持.pdf
《中国数据库行业分析报告:向量启航引擎加持.pdf》由会员分享,可在线阅读,更多相关《中国数据库行业分析报告:向量启航引擎加持.pdf(44页珍藏版)》请在咨信网上搜索。
1、modb.promodb.pro向量启航,向量启航,引擎加持引擎加持20222022年年1010月月中国中国数据库行业分析报告数据库行业分析报告墨天轮行业分析研究中心墨天轮行业分析研究中心2022-10-152022-10-15乐/知/乐/享 同/心/共/济摘要摘要www.modb.pro2022年10月的 墨天轮中国数据库流行度排行榜火热出炉,本月共有245个数据库参与排名,相比上月新增七个数据库,本月排行榜前十名变动较大:达梦数据库上市程序恢复,热度大涨,排名反超openGauss,重回第三;华为旗下两大数据库品牌名次均下降;云原生数据库云原生数据库PolarDBPolarDB、TDSQL
2、TDSQL再创佳绩,名次均上升一位再创佳绩,名次均上升一位。本月排行榜从第十一名至第三十名,竞争激烈,归属变动较大。在这一赛道中,本月也崛起了一批数据库新秀,拥有亮眼的表现。本月报告中墨天轮发布了最新向量数据库全球产业图谱最新向量数据库全球产业图谱,国内典型向量数据库代表有Milvus、Vearch、TensorDB、Om-iBASE等。向量数据库是专门为处理向量嵌入独特结构而构建的数据库系统。它们通过比较值并找到彼此最相似的向量来索引向量,以便于搜索和检索。从技术角度来讲,向量数据库主要解决向量数据库主要解决2 2个问题,一个个问题,一个是高效的检索,另一个是高效的分析是高效的检索,另一个是
3、高效的分析。向量数据库其实就像传统数据去处理一些关系型数据、结构化数据一样,承担的是非结构化数据的低成本存储和高性能计算两大核心能力。具体包括用于搜索和检索的向量索引、单级过滤、数据分片、复制、混合存储以及API功能。向量数据库主要的应用领域如人脸识别、推荐系统、图片搜索、人脸识别、推荐系统、图片搜索、视频指纹、语音处理、自然语言处理、文件搜索视频指纹、语音处理、自然语言处理、文件搜索等。随着 AI 技术的广泛应用,以及数据规模的不断增长,向量检索也逐渐成了 AI 技术链路中不可或缺的一环,更是对传统搜索技术的补充,并且具备多模态搜索的能力。随着数据库软硬件技术的发展,经典的SQL计算引擎逐渐
4、成为数据库系统的性能瓶颈,尤其是对于涉及到大量计算的OLAP场景。如何充分发挥底层硬件的能力,提升数据库系统的性能,成为近年来数据库领域的热门研究方向,而向量化执行就是解决上述问题的一种有效手段向量化执行就是解决上述问题的一种有效手段。火山模型的诞生为缓存数据库的内存压力,但该设计并未充分利用CPU的执行效率且以往的火山模型一次处理一个元组的方式造成过大的解释执行代价,阻止了对性能影响极大的编译优化。2005年MonetDB/X100:Hyper-Pipelining Query Execution的论文首次提出“向量化引擎”的概念,后续国产数据库陆续推出向量化执行引擎,加速加速OLAPOLA
5、P场景的查询分析速度场景的查询分析速度。mNwOnNoMqPmPwOyRmOqMqM9PaO6MtRrRoMtRiNnMoOiNmOvNaQnNxPMYnOsMuOmPuM乐/知/乐/享 同/心/共/济目录目录 contentcontent一、数据库排行榜及前沿动态一、数据库排行榜及前沿动态二、向量数据库二、向量数据库的概述与的概述与解析解析三、三、向量引擎加持传统数据库向量引擎加持传统数据库四、向量数据库四、向量数据库产品相关产品相关案例案例乐/知/乐/享 同/心/共/济实干兴邦实干兴邦-前四强合成前四强合成 TODO TODO 促促成长成长来源:墨天轮排行榜秋风萧瑟,洪波涌起。2022年1
6、0月的墨天轮中国数据库流行度排行榜火热出炉,本月共有245个数据库参与排名,相比上月新增七个数据库,本月排行榜前五名变动较大:达梦数据库上市程序恢复,热度大涨,排名反超openGauss,重回第三;PolarDB上升一位居第五。20222022年年1010月中国数据库排行榜月中国数据库排行榜TOP5TOP5TiDB本月得分612.45分,较上月得分环比上涨5.4%。这也是其今年6月重夺榜单第一宝座后,连续五个月稳坐榜首。自2020年1月至今,TiDB已累计霸榜33个月。O c e a n B a s e 本 月 得 分584.12分,与第一名得分差距从上个月的44.23分缩小至28.33分。其
7、本月分数涨幅最大,较上月得分上涨8.8%,排名第二。达 梦 本 月 得 分 较 上 月 上 涨20.9分,以556.12分摘得探花。其上月排名被反超后,一直奋力向上,本月排名赶超openGauss。达梦自递交入股申请书后,一直备受关注。openGauss本月得分较上月仅下降2.37分,排名却下降一位居第四。9月30日,openGauss迎来了里程碑事件,openGauss3.1.0版本正式上线,此版本与之前版本特性功能保持兼容。PolarDB作为国产云原生数据库中的佼佼者,本月排名赶超GaussDB这一云上竞争对手。其本月得分下降5.08分,以不到一分的微弱优势排名第五。乐/知/乐/享 同/心
8、/共/济稳中求进稳中求进-金仓、金仓、T TDSQLDSQL立足创新创佳绩立足创新创佳绩来源:墨天轮排行榜20222022年年1010月中国数据库排行榜月中国数据库排行榜TOP6-TOP10TOP6-TOP10其是华为云自研数据库的统一品牌,本月得分435.39分,以不到1分的微弱劣势被反超。9月,GaussDB亮相华为全联接2022曼谷站,其动向不太频繁,热度上有所降低。GaussDBGaussDB其是南大通用数据技术有限公司推出的自主品牌的数据库产品。九月,GBase南大通用数据库相继中标成都农商行&自贡银行&泉州银行等多个重点项目。GBaseGBase其是腾讯云企业级分布式数据库,本月得
9、分279.70分,以4.53分的优势领先GBase。近日,腾讯云数据库以其过硬的产品,成功中标中国邮政4年订单。TDSQLTDSQL其是成立最早的国产数据库厂商,据太极股份的半年财报,人大金仓2022上半年营收1.23亿、净利润940万。其本月以4.02分的分数劣势,排名第七。人大金仓人大金仓本月得分较上月下降13.64分,连续13个月蝉联墨天轮排行榜第十名。其是阿里云自主研发的一款实时分析数据库,在云上拥有一席之地。新环境下,AnalyticDB也一直在打磨产品。AnalyticDBAnalyticDB乐/知/乐/享 同/心/共/济异军突起异军突起-后起之秀细分领域后起之秀细分领域闪耀光芒闪
10、耀光芒来源:墨天轮排行榜20222022年年1010月中国月中国数据库新秀得分详情表数据库新秀得分详情表本月排行榜从第十一名至第三十名,竞争激烈,归属变动较大。在这一赛道中,本月也崛起了一批数据库新秀,拥有亮眼的表现。MogDBMogDB云和恩墨基于 openGauss 内核进行增强提升,推出的一款安稳易用的企业级关系型数据库MogDB,本月排名上升两位至第17名,逐渐逼近前十赛道。上个月MogDB力争上游,在市场拓展和生态建设上都卓有成效。DolphinDBDolphinDB由浙江智臾科技有限公司研发的一款高性能分布式时序数据库,公司主创团队从2012年开始投入研发,本月排名上升两位至第20
11、名,也是排行榜上排名第二的时序数据库。StarRocksStarRocks北京鼎石纵横科技有限公司于2020年推出的一款新一代极速MPP分析型数据库系统,本月排名跃升六位至第21名。9月24日,年度盛典 StarRocks Summit Asia 2022 顺利举行,9月27日,StarRocks2.3.3重磅发布。TGDBTGDB腾讯云推出的原生分布式并行图数据库TGDB是排行榜上图数据库第一名。其排名上升两位至第27名。它不仅具备图数据库的优点,还兼具原生图数据库的关联关系深链查询能力和分布式图数据库的数据延展性及计算性能。CTSDBCTSDB墨天轮排行榜上时序数据库第三名CTSDB,在整
12、体排名中较上月排名上升三位至第28名。CTSDB是腾讯唯一的时序数据库,其支撑了腾讯内部20多个核心业务。KunDBKunDB其是2019年星环科技推出了一款分布式关系型数据库,其本月排名较上月虽未发生变化,但是实力不容小觑。近日,星环科技获得证监会批准,正式进入科创板IPO发行阶段,将成为“国产大数据基础软件第一股”。乐/知/乐/享 同/心/共/济产品动态产品动态-openGauss 3.1.0openGauss 3.1.0版本正式发布版本正式发布来源:openGauss官网2022年9月30日,openGauss 3.1.0版本正式上线!openGauss 3.1.0版本是 openGau
13、ss 2022年发布的Preview版本,版本维护生命周期为半年。此次发布包含两个数据库服务端安装包:企业版和轻量版。openGauss 3.1.0版本与之前版本特性功能保持兼容,在企业级特性、高可用、高性能、高智能、高安全、工具链、可扩展性企业级特性、高可用、高性能、高智能、高安全、工具链、可扩展性七大特性上全面增强。企业级特性企业级特性1 1.行存表压缩能力增强行存表压缩能力增强2.2.发布订阅能力增强发布订阅能力增强3.3.细粒度滚动升级细粒度滚动升级4.statement_history4.statement_history视图诊断能力增强视图诊断能力增强1 1.两地三中心跨两地三中心
14、跨RegionRegion容灾容灾2.CM2.CM支持对外状态查询和推送能力支持对外状态查询和推送能力3.DCF3.DCF(Distributed Consensus Distributed Consensus FrameworkFramework,分布式共识框架,基于,分布式共识框架,基于PaxosPaxos算法实现数据同步强一致。)支持算法实现数据同步强一致。)支持策略化多数派策略化多数派高可用高可用高性能高性能基础算子性能提升基础算子性能提升 新选择率模型典型场景选择率估算准确率、性能提升1X 分区表页面估算优化典型场景性能提升20%。Partition Iterator算子优化典型场景
15、性能提升5%。函数依赖特性支撑多列查询典型场景行数估算准确率提升1X。1.DBMind1.DBMind自治运维平台自治运维平台构建端到端自治运维平台:新增异常检测能力,完善自监控、自诊断、自调优能力。2 2、智能优化器智能优化器 实现库内Bayes网络算法并基于此实现智能统计信息以提高多列基数估计准确度。计划自适应选择解决因数据倾斜等跳变难题。高智能高智能高安全高安全工具链工具链细粒度细粒度AnyAny权限增强权限增强Any权限管理,新增支持5种对象共12种:ALTER ANY TYPE、DROP ANY TYPE ALTER ANY SEQUENCE、DROP ANY SEQUENCE、SE
16、LECT ANY SEQUENCE ALTER ANY INDEX、DROP ANY INDEX CREATE ANY TRIGGER、ALTER ANY TRIGGER、DROP ANY TRIGGER CREATE ANY SYNONYM、DROP ANY SYNONYM1.MySQL1.MySQL全量迁移性能提升全量迁移性能提升2.MySQL2.MySQL增量迁移支持事务级并行消费,提增量迁移支持事务级并行消费,提升增量迁移性能升增量迁移性能3.3.支持基于默克尔树的数据校验支持基于默克尔树的数据校验4.4.支持支持openGaussopenGauss到到MySQLMySQL迁移,满足迁
17、移,满足MySQLMySQL反向迁移要求反向迁移要求可扩展性可扩展性集成集成openLookengopenLookeng,提供分布式提供分布式OLAPOLAP能力能力基于openLookeng实现分布式分析能力,openLookeng复用ShardingSphere中间件的分库分表能力,使openLookeng可以获取openGauss数据进行分析运算。加上ShardingSphere搭配openGauss形成的分布式OLTP能力一起组合成分布式的HTAP能力。立即体验:https:/opengauss.org/zh/download.html 乐/知/乐/享 同/心/共/济产品动态产品动态-
18、Oracle 23cOracle 23c新特性和发布新特性和发布周期周期计划计划来源:墨天轮、DOAG 2022会议DOAG 2022 会议上,Oracle 的产品经理 Gerald Venzl 披露了 Oracle Database 23c 的一系列新特性。Oracle Database 23c 的发布计划已经明确公布,在2022年,Beta版已经开始测试。新版本将在2023年发布,23c 是一个长期支持版本。Oracle 23c Oracle 23c 十小新特性十小新特性01 01 不带不带FROMFROM子句的子句的SELECTSELECT查询查询02 02 单表支持单表支持409640
19、96列列03 03 SCHEMA SCHEMA 级别的权限级别的权限04 04 Boolean Boolean 数据类型数据类型05 05 基于别名和基于别名和位置的位置的GROUP BYGROUP BY06 06 Javascript Javascript 存储过程存储过程07 07 SQL DomainsSQL Domains08 08 DDLDDL的的 IF EXISTS IF EXISTS判断判断09 09 数据库数据库对象对象增加注释增加注释10 10 标准的表值构建标准的表值构建升级到升级到Oracle 23cOracle 23c的路径的路径11g11g12c12c12c12c18
20、c18c19c19c21c21c23c23c20192019 20202020 2021202120222022 20232023 20242024 20252025 20262026 20272027 20282028 20292029 20302030 2031203120322032 2033203319c Long Term19c Long TermWaived Waived Ext.Ext.ExtendedExtended21c Innovation21c InnovationBetaBeta23c Long Term23c Long TermExtendedExtended版版 本
21、本 发发 布布 周周 期期 计计 划划RELEASE 2RELEASE3乐/知/乐/享 同/心/共/济学术动态学术动态-中国在中国在VLDBVLDB20222022的论文盘点的论文盘点来源:http:/vldb.org/pvldb/volumes/15/VLDB2022于9月5日召开,VLDB(Very Large Data Base)作为数据库领域的三大顶级国际会议之一,是面向数据库研究人员,内核开发人员,开发商以及用户的年度国际会议论坛,代表数据库系统领域最杰出的研究和工程进展。VLDB2022会议中共有336篇国内外论文入选,其中中国贡献115篇,占比超过1/3。由于单篇论文有多个作者,
22、来源地不同,以下数据含重复计数。115115221221国内外收录论文数分析国内外收录论文数分析国内国内国外国外14141 11 11 14 44 41 11 14 42 20 05 510101515AlibabaAlibabaOceanBaseOceanBaseZillizZillizPingCAPPingCAP腾讯腾讯华为华为美团美团百度百度字节字节快手快手数量数量23238 85 54 45 55 52 21 10 05 51010151520202525MicrosoftMicrosoftMetaMetaAmazonAmazonSAPSAPIBMIBMGoogleGoogleOrac
23、leOracleeBayeBay国外收录论文主要来源单位国外收录论文主要来源单位数量数量国内收录论文主要学术机构来源国内收录论文主要学术机构来源香港科技大学香港科技大学 1717篇篇香港中文大学香港中文大学 9 9篇篇北京大学北京大学 1111篇篇清华大学清华大学 1313篇篇中国人民大学中国人民大学 6 6篇篇国产数据库厂商被收录论文数国产数据库厂商被收录论文数乐/知/乐/享 同/心/共/济调研动态调研动态-四家图四家图数据库厂商数据库厂商入选入选GartnerGartner调研调研报告报告近日,国际知名调研机构Gartner发布了聚焦图技术的调研报告图数据库管理系统市场指南(以下简称“指南
24、”),在全球范围内,甄选出了32家图数据库代表性供应商,Galaxybase、AtlasGraph、Ultipa、StellarDB四个数据库作为优质图数据库入选指南,获得了业界积极评价和高度认可。指南从图技术市场现状,未来发展方向、图数据库选型等多个维度深入分析,明确市场发展趋势和竞争格局,为企业客户提供战略参考。来源:墨天轮、各厂商官网网网图数据库管理系统市场指南图数据库管理系统市场指南亮点亮点图数据库分类图数据库分类03 Gartner依据底层存储将图数据库大致划分为原生图数据库和多模图数据库两大类型。原生图数据库,相较于多 模 数 据 库,更 适 用 于 涉 及 实 时 计算、多跳查询
25、和机器学习(ML)等资源密集型处理场景。原生图数据库在处理超大规模图(通常是数十亿个节点)的查询时能提供更优质的性能。”图数据库受众画像图数据库受众画像02 程序开发员程序开发员:正在将更多地面向客户或内部的项目转向图技术,利用图数据库作为存储和执行后端。数据架构师数据架构师:正在为内容管理、个性化和语义数据兼容性设计基于知识图谱的解决方案。数据科学家数据科学家:对数据点、边之间的连接和关系进行高阶探索。业务所有者和领域专家。业务所有者和领域专家。图数据库市场趋势性预测图数据库市场趋势性预测01 到 2 0 2 5 年,包 括 图 数 据 库 管 理 系 统(DBMSs)在内的图技术市场将增长
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 中国 数据库 行业 分析 报告 向量 启航 引擎
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【宇***】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【宇***】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。