福彩销售大数据平台设计与应用_樊东霞.pdf
《福彩销售大数据平台设计与应用_樊东霞.pdf》由会员分享,可在线阅读,更多相关《福彩销售大数据平台设计与应用_樊东霞.pdf(4页珍藏版)》请在咨信网上搜索。
1、众创空间科技创新与应用Technology Innovation and Application2023年8期福彩销售大数据平台设计与应用樊东霞(中国福利彩票发行管理中心数据管理部,北京 100101)目前福彩系统的信息化建设,多以各省具体的信息化需求为出发点开展工作,即开票、电脑票销售系统均由各省福彩中心自行建设,导致原始数据缺乏统一的技术标准与数据标准规范,中国福利彩票发行管理中心(以下简称“中福彩中心”)对原始数据的实时收集与处理存在困难,无法对业务开展的事中风险进行排查与管控,在营销宣传、渠道管理、数据管理与应用管理等方面存在一定制约,对系统整体的架构规划、架构管控方面存在不足,因此亟
2、需站在系统全局视角,整合中福彩中心层面和各省市中心层面的信息化需求,加强数据统筹管理。福彩销售大数据平台基于大数据技术设计与开发,为整合各省销售数据资源,打造集数据接入、数据处理、数据存储、监测管理、BI 报表和可视化平台于一体的大数据平台,着力提升信息化管理与服务能力,实现数据要素价值的充分发挥。1大数据技术随着计算机技术全面融入社会生活,移动互联、电子商务平台、社交媒体和物联网技术正在不断改变人们的生活方式,其数据量与对传输速率的要求超过了传统数据库的处理能力,数据的爆发式增长与社会属性是大数据概念及相关技术应运而生的本质原因,维克托 迈尔-舍恩伯格1将大数据定义为不用随机分析法这样的捷径
3、,而采用所有数据的方法。大数据也可用5V 特征概括,主要包括 Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)和 Veracity(真实性)。1)Volume:数据量的超大规模与数据的高速增长。2)Velocity:对海量数据的快速处理。3)Variety:数据格式多样化,既包括结构化数据,也包括语音、图片和视频等非结构化数据。4)Value:数据的低密度价值,数据存在大量不相关信息,需要通过技术手段挖掘其中的有用信息。5)Veracity:数据的准确性,即数据质量。大数据技术主要包括数据收集、数据存储、数据计算和大数据分析与应用,如图 1 所示
4、。1.1数据收集数据收集是大数据的基础,数据只有经过了数据作者简介:樊东霞(1986-),女,硕士,工程师。研究方向为信息安全,大数据技术。摘要:随着中国福利彩票发行管理中心对数据管控和业务监管的要求不断提高,对销售数据实时性、准确性也提出更高要求。通过建设福利彩票销售大数据平台,实现全国范围内彩票销售数据的实时归集,为彩票的发行销售业务提供数据支撑与决策依据。目前每天约有数千万条彩票销售数据实时传报归集,并通过大数据平台实现对彩票业务的监管。关键词:彩票;大数据;系统设计;数据分析;引擎中图分类号:TP391文献标志码:A文章编号:2095-2945(2023)08-0033-04Abstr
5、act:With the increasing requirements of China Welfare Lottery Center for data control and business supervision,it alsoposed higher requirements for the real-time and accuracy of sales data.Through the construction of welfare lottery sales big dataplatform,the real-time collection of national lottery
6、 sales data is realized,which provides data support and decision-making basisfor lottery issuance and sales business.At present,about ten million national lottery sales data are collected and reported in realtime every day,and the lottery business is regulated through the big data platform.Keywords:
7、lottery;big data;system design;data analysis;engineDOI:10.19981/j.CN23-1581/G3.2023.08.00833-2023年8期众创空间科技创新与应用Technology Innovation and Application收集才能归并,以供后续进一步处理。数据源根据不同的类型和应用场景,可分为关系及非关系型数据库、应用的日志信息、消息型数据和多媒体文档等,不同类型的数据需要采用不同的数据收集技术框架。常见的数据收集技术框架包括 Kafka、Flume、Logstash、FileBeat和 Sqoop 等。图1大数据技术结
8、构图1.2数据存储目前传统的关系型数据库已不能适应结构化、半结构化和非结构化海量数据的存储及计算要求,选用何种数据库一般会根据数据的类型及使用场景选择一种或多种的大数据存储方式。如分布式文件/对象数据库可采用 HDFS,分布式关系数据库可采用 TiDB、DRDS 等,文档数据库可采用 MongoDb、CouchDB 等,图数据库可采用 Neo4J、OrientDB 等。大数据存储有时也配搭传统关系数据库作为辅助,如存储索引、统计结果等。1.3数据计算大数据计算常用框架主要包含批处理框架、流处理框架。批处理是先存储后处理,而流处理是直接处理2。Hadoop 是应用较为广泛的批处理框架,其包含分布
9、式文件存储数据库 HDFS 和计算框架 MapReduce,HDFS 为海量数据提供了存储,MapReduce 对海量的数据进行计算。流处理框架以 Storm 为代表,无须存储,只要数据源处于活动状态,数据就会持续生成,并以流的形式在各工作节点的内存中进行计算3,此外还有 Spark、Flink 等混合计算框架。1.4大数据分析与应用大数据技术的应用场景很广泛,常见的如各种统计分析报表、BI 报表、客户画像、信息推送和定制化服务等,目前在金融行业、医疗行业、零售行业、互联网和电信行业等各领域均有涉及。2平台系统架构2.1系统总体架构销售大数据平台整体分为 3 层,即数据资源层、数据平台层和数据
10、应用层。数据流向如图 2 所示,数据资源层数据通过数据接收平台流向数据平台层,数据平台层接收并存储数据资源层数据,并通过数据清洗、数据转换和挖掘分析,为数据应用层提供数据服务,数据应用层提供数据引擎进行并展示各种统计数据,同时对业务进行实时监控与风险控制。图2数据平台总体架构2.1.1数据资源层数据资源层主要包括各省中心上传的即开票销售数据、即开票仓储物流数据、电脑票销售数据、弃奖数据、兑奖数据和渠道数据等,也包括各省中心应用服务数据、容灾备份等其他数据。2.1.2数据平台层数据平台层包含数据接收平台、ETL 服务、数据存储平台和管理控制单元等,将数据资源进行接收、存储与加工整合。数据平台层提
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 福彩 销售 数据 平台 设计 应用 樊东霞
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。