大数据应用解决专业方案.doc
《大数据应用解决专业方案.doc》由会员分享,可在线阅读,更多相关《大数据应用解决专业方案.doc(41页珍藏版)》请在咨信网上搜索。
1、大数据应用处理方案目 录1.大数据概述61.1.概述61.2.大数据定义61.3.大数据技术发展82.大数据应用112.1.大数据应用叙述112.2.大数据应用架构132.3.大数据行业应用132.3.1.医疗行业132.3.2.能源行业142.3.3.通信行业142.3.4.零售业153.大数据处理方案163.1.大数据技术组成163.1.1.分析技术163.1.1.1.可视化分析163.1.1.2.数据挖掘算法163.1.1.3.估计分析能力163.1.1.4.语义引擎163.1.1.5.数据质量和数据管理173.1.2.存放数据库173.1.3.分布式计算技术183.2.大数据处理过程2
2、03.2.1.采集203.2.2.导入/预处理213.2.3.统计/分析213.2.4.挖掘213.3.大数据处理关键技术-Hadoop213.3.1.Hadoop组成223.3.2.Hadoop优点:253.3.2.1.高可靠性。253.3.2.2.高扩展性。253.3.2.3.高效性。253.3.2.4.高容错性。253.3.3.Hadoop不足253.3.4.关键商业性“大数据”处理方案263.3.2.5.IBM InfoSphere大数据分析平台263.3.2.6.Or a c l e Bi g Da t aApplianc273.3.2.7.Mi c r o s o f t S QL
3、Server273.3.2.8.Sybase IQ283.3.5.其它“大数据”处理方案283.3.2.9.EMC283.3.2.10.BigQuery293.3.6.大数据”和科技文件信息处理293.4.大数据处理技术发展前景293.4.1.大数据复杂度降低293.4.2.大数据细分市场303.4.3.大数据开源303.4.4.Hadoop将加速发展303.4.5.打包大数据行业分析应用303.4.6.大数据分析革命性方法出现313.4.7.大数据和云计算:深度融合313.4.8.大数据一体机陆续公布314.基于基站大数据应用及案例324.1.气象灾难应急短信公布平台324.1.1.概述32
4、4.1.1.1.项目背景324.1.1.2.平台概述324.1.2.平台建设特点和标准324.1.2.1.建设特点324.1.2.2.建设标准324.1.2.3.大数据管理平台特点334.1.3.平台整体架构334.1.3.1.建设原理334.1.3.2.平台总体设计351.平台总体结构352.平台技术架构364.1.3.3.平台技术思绪374.1.3.4.平台技术路线381.内存数据库382.短信发送多链路配置383.队列缓存384.参数可配置384.1.3.5.平台性能要求384.1.4.平台网络拓扑384.1.5.平台关键步骤394.1.5.1.平台数据步骤394.1.5.2.平台业务主
5、步骤404.1.5.3.短信下发审批步骤414.1.5.4.信令分析处理步骤424.1.5.5.短信发送步骤434.1.6.平台功效模块434.1.6.1.信令分析子系统434.1.6.2.短信发送子系统441.短信发送功效442.短信回执接收功效443.短信批量发送管理功效454.统计报表454.1.6.3.管理子系统451.用户管理452.权限管理463.实时监控464.日志管理465.基站位置信息管理466.系统参数配置管理464.1.6.4.内容数据库子系统464.1.7.平台外部接口474.1.7.1.信令采集接口471.接口说明472.数据采集模式474.1.7.2.短信发送接口4
6、71.短信发送通知接口472.短信发送状态查询接口473.短信发送接口474.1.7.3.基站位置信息接口481.数据同时模式482.基站位置信息全量同时接口483.基站位置信息增量同时接口484.2.旅游客源分析484.2.1.建设目标484.2.2.整体方案494.2.2.1.方案思绪494.2.2.2.分析范围494.2.2.3.方案特点504.2.3.方案设计514.2.3.1.系统关系514.2.3.2.系统架构511.数据分析后台能力522.Web前台能力524.2.3.3.数据采集534.2.3.4.业务分析531.总体分析步骤532.景区综合流量统计分析543.景区游客起源地组
7、成份析554.景区全网总游客实时估算575.景区流量预判模型分析586.景区流量上限告警597.旅游景点热度排名分析598.旅游线路归类统计609.景区和相关场所关联分析614.2.3.5.界面功效介绍611.菜单功效列表622.界面辅助功效介绍633.运行部门应用Portal644.用户权限641. 大数据概述1.1. 概述大数据,IT行业又一次技术变革,大数据浪潮汹涌而至,对国家治理、企业决议和个人生活全部在产生深远影响,并将成为云计算、物联网以后信息技术产业领域又一重大创新变革。未来十年将是一个“大数据”引领智慧科技时代、伴随社交网络逐步成熟,移动带宽快速提升、云计算、物联网应用愈加丰富
8、、更多传感设备、移动终端接入到网络,由此而产生数据及增加速度将比历史上任何时期全部要多、全部要快。数据技术发展历史图一所表示:图一1.2. 大数据定义“大数据”是一个涵盖多个技术概念,简单地说,是指无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理数据集合。IBM将“大数据”理念定义为4个V,即大量化(Volume)、多样化(Variety)、快速化(Velocity)及由此产生价值(Value)。图二;图二要了解大数据这一概念,首先要从大入手,大是指数据规模,大数据通常指在10TB(1TB=1024GB)规模以上数据量。大数据同过去海量数据有所区分,其基础特征能够用4个V来总结(Vo
9、l-ume、Variety、Value和Veloc-ity),即体量大、多样性、价值密度低、速度快。 数据体量巨大。从TB等级,跃升到PB等级。 数据类型繁多,如前文提到网络日志、视频、图片、地理位置信息,等等。 价值密度低。以视频为例,连续不间断监控过程中,可能有用数据仅仅有一两秒。 处理速度快。1秒定律。最终这一点也是和传统数据挖掘技术有着本质不一样。物联网、云计算、移动互联网、车联网、手机、平板电脑、PC和遍布地球各个角落多种多样传感器,无一不是数据起源或承载方法。大数据技术是指从多种多样类型巨量数据中,快速取得有价值信息技术。处理大数据问题关键是大数据技术。现在所说大数据不仅指数据本身
10、规模,也包含采集数据工具、平台和数据分析系统。大数据研发目标是发展大数据技术并将其应用到相关领域,经过处理巨量数据处理问题促进其突破性发展。所以,大数据时代带来挑战不仅表现在怎样处理巨量数据从中获取有价值信息,也表现在怎样加强大数据技术研发,抢占时代发展前沿。1.3. 大数据技术发展大数据技术描述了一个新一代技术和构架,用于以很经济方法、以高速捕捉、发觉和分析技术,从多种超大规模数据中提取价值,而且未来急剧增加数据迫切需要寻求新处理技术手段。图三所表示:图三在“大数据”(Big data)时代,经过互联网、社交网络、物联网,大家能够立即全方面地取得大信息。同时,信息本身存在形式改变和演进,也使
11、得作为信息载体数据以远超大家想象速度快速膨胀。云时代到来使得数据发明主体由企业逐步转向个体,而个体所产生绝大部分数据为图片、文档、视频等非结构化数据。信息化技术普及使得企业更多办公步骤经过网络得以实现,由此产生数据也以非结构化数据为主。估计到,非结构化数据将达成互联网整个数据量75%以上。用于提取智慧“大数据”,往往是这些非结构化数据。传统数据仓库系统、BI、链路挖掘等应用对数据处理时间要求往往以小时或天为单位。但“大数据”应用突出强调数据处理实时性。在线个性化推荐、股票交易处理、实时路况信息等数据处理时间要求在分钟甚至秒级。全球技术研究和咨询企业Gartner将“大数据”技术列入对众多企业和
12、组织机构含有战略意义十大技术和趋势之一,而其它领域研究,如云计算、下一代分析、内存计算等也全部和“大数据”研究相辅相成。Gartner在其新兴技术成熟度曲线中将“大数据”技术视为转型技术,这意味着“大数据”技术将在未来35年内进入主流。而 “大数据”多样性决定了数据采集起源复杂性,从智能传感器到社交网络数据,从声音图片到在线交易数据,可能性是无穷无尽。选择正确数据起源并进行交叉分析能够为企业发明最显著利益。伴随数据源爆发式增加,数据多样性成为“大数据”应用亟待处理问题。比如怎样实时地及经过多种数据库管理系统来安全地访问数据,怎样经过优化存放策略,评定目前数据存放技术并改善、加强数据存放能力,最
13、大程度地利用现有存放投资。从某种意义上说,数据将成为企业关键资产。“大数据”不仅是一场技术变革,更是一场商业模式变革。在“大数据”概念提出之前,尽管互联网为传统企业提供了一个新销售渠道,但总体来看,二者平行发展,鲜有交集。我们能够看到,不管是谷歌经过分析用户个人信息,依据用户偏好提供正确广告,还是Facebook将用户线下社会关系迁移在线上,结构一个半真实实名帝国,但这些商业和消费模式仍不能脱离互联网,传统企业仍无法嫁接到互联网中。同时,传统企业经过传统用户分析工具却极难取得大范围用户真实需求。企业从大规模制造过渡到大规模定制,必需掌握用户需求特点。在互联网时代,这些需求特征往往是在用户不经意
14、行为中透露出来。经过对信息进行关联、参考、聚类、分类等方法分析,才能得到答案。“大数据”在互联网和传统企业间建立一个交集。它推进互联网企业融合进传统企业供给链,并在传统企业种下互联网基因。传统企业和互联网企业结合,网民和消费者融合,必将引发消费模式、制造模式、管理模式巨大变革。大数据正成为IT行业全新制高点,各企业和组织纷纷助推大数据发展,相关技术展现百花齐放局面,并在互联网应用领域崭露头角,具体情况以下图四所表示:图四大数据将带来巨大技术和商业机遇,大数据分析挖掘和利用将为企业带来巨大商业价值,而伴随应用数据规模急剧增加,传统计算面临严重挑战,大规模数据处理和行业应用需求日益增加和迫切出现越
15、来越多大规模数据处理应用需求,传统系统难以提供足够存放和计算资源进行处理,云计算技术是最理想处理方案。调查显示:现在,IT专业人员对云计算中很多关键技术最为关心是大规模数据并行处理技术大数据并行处理没有通用和现成处理方案对于应用行业来说,云计算平台软件、虚拟化软件全部不需要自己开发,但行业大规模数据处理应用没有现成和通用软件,需要针对特定应用需求专门开发,包含到很多并行化算法、索引查询优化技术研究、和系统设计实现,这些全部为大数据处理技术发展提供了巨大驱动力,2. 大数据应用2.1. 大数据应用叙述大数据能做什么?我们那么多地方探讨大数据,无非总结下来就做三件事:第一,对信息了解。你发每一张图
16、片、每一个新闻、每一个广告,这些全部是信息,你对这个信息了解是大数据关键领域。第二,用户了解,每个人基础特征,你潜在特征,每个用户上网习惯等等,这些全部是对用户了解。第三,关系。关系才是我们关键,信息和信息之间关系,一条微博和另外一条微博之间关系,一个广告和另外一个广告关系。一条微博和一个视频之间关系,这些在我们肉眼去看时候是相对简单。比如有条微博说这两天朝鲜绑架我们船事,那条微博也大约是谈这件事。人眼一眼就能看出来。不过用机器怎么能看出来这是一件事,和她们之间因果关 系,这是很有难度。然后就是用户和用户之间关系。哪些人你愿意收听,是你好友,哪些是你感爱好领域,你是一个音乐达人,你是一个吃货,
17、那个用户也 是一个吃货,你愿意收听她。这就是用户和用户之间关系了解。还有用户和信息之间了解,就是你对哪一类型微博感爱好,你对哪一类型信息感爱好,假如 牵扯到商业化,你对哪一类广告或商品感爱好。其实就是用户和信息之间关系,她无非是做这件事。大数听说那么悬,其实关键是做三件事:对用户了解、对信息了解、对关系了解。假如我们在这三件事之间还要提一件事话,一个叫趋势。 她也是关系一个变种,只是关系稍微远一点,情感之间分析,还有我们政府部门做舆情监控。她能够监控大规模数据,能够分析出人动向。在美国好莱 坞,这两年也是基于FACEBOOK和TIWTTER数据来估计立即上映电影票房。她也是一个趋势分析,只是我
18、们把这个趋势提前来。关键就是这三件事。2.2. 大数据应用架构2.3. 大数据行业应用2.3.1. 医疗行业1. Seton Healthcare是采取IBM最新沃森技术医疗保健内容分析估计首个用户。该技术许可企业找到大量病人相关临床医疗信息,经过大数据处理,愈加好地分析病人信息。2. 在加拿大多伦多一家医院,针对早产婴儿,每秒钟有超出3000次数据读取。经过这些数据分析,医院能够提前知道哪些早产儿出现问题而且有针对性地采取方法,避免早产婴儿夭折。3. 它让更多创业者更方便地开发产品,比如经过社交网络来搜集数据健康类App。可能未来数年后,它们搜集数据能让医生给你诊疗变得更为正确,比方说不是通
19、用成人每日三次一次一片,而是检测到你血液中药剂已经代谢完成会自动提醒你再次服药。2.3.2. 能源行业1. 智能电网现在欧洲已经做到了终端,也就是所谓智能电表。在德国,为了激励利用太阳能,会在家庭安装太阳能,除了卖电给你,当你太阳能有多出电时候还能够买回来。经过电网搜集每隔五分钟或十分钟搜集一次数据,搜集来这些数据能够用来估计用户用电习惯等,从而推断出在未来23个月时间里,整个电网大约需要多少电。有了这个估计后,就能够向发电或供电企业购置一定数量电。因为电有点像期货一样,假如提前买就会比较廉价,买现货就比较贵。经过这个估计后,能够降低采购成本。2. 维斯塔斯风力系统,依靠是BigInsight
20、s软件和IBM超级计算机,然后对气象数据进行分析,找出安装风力涡轮机和整个风电场最好地点。利用大数据,以往需要数周分析工作,现在仅需要不足1小时便可完成。2.3.3. 通信行业1. XO Communications经过使用IBM SPSS估计分析软件,降低了快要二分之一用户流失率。XO现在能够估计用户行为,发觉行为趋势,并找出存在缺点步骤,从而帮助企业立即采取方法,保留用户。另外,IBM新Netezza网络分析加速器,将经过提供单个端到端网络、服务、用户分析视图可扩展平台,帮助通信企业制订更科学、合理决议。2. 电信业者透过数以千万计用户资料,能分析出多个使用者行为和趋势,卖给需要企业,这是
21、全新资料经济。3. 中国移动经过大数据分析,对企业运行全业务进行针对性监控、预警、跟踪。系统在第一时间自动捕捉市场改变,再以最快捷方法推送给指定责任人,使她在最短时间内获知市场行情。4. NTT docomo把手机位置信息和互联网上信息结合起来,为用户提供周围餐饮店信息,靠近末班车时间时,提供末班车信息服务。2.3.4. 零售业1. 我们某个用户,是一家领先专业时装零售商,经过当地百货商店、网络及其邮购目录业务为用户提供服务。企业期望向用户提供差异化服务,怎样定位企业差异化,她们经过从 Twitter 和 Facebook 上搜集社交信息,更深入了解化妆品营销模式,随即她们认识到必需保留两类有
22、价值用户:高消费者和高影响者。期望经过接收无偿化妆服务,让用户进行口碑宣传,这是交易数据和交互数据完美结合,为业务挑战提供了处理方案。Informatica技术帮助这家零售商用社交平台上数据充实了用户主数据,使她业务服务更含有目标性。2. 零售企业也监控用户店内走动情况和和商品互动。它们将这些数据和交易统计相结合来展开分析,从而在销售哪些商品、怎样摆放货物和何时调整售价上给出意见,这类方法已经帮助某领先零售企业降低了17%存货,同时在保持市场份额前提下,增加了高利润率自有品牌商品百分比。3. 大数据处理方案1.2.3.3.1. 大数据技术组成大数据技术由四种技术组成,它们包含:3.1.1. 分
23、析技术分析技术意味着对海量数据进行分析以实时得出答案,因为大数据特殊性,大数据分析技术还处于发展阶段,老技术会日趋完善,新技术会更多出现。大数据分析技术涵盖了以下五个方面3.1.1.1. 可视化分析数据可视化不管对于一般用户或是数据分析教授,全部是最基础功效。数据图像化能够让数据自己说话,让用户直观感受到结果。3.1.1.2. 数据挖掘算法图像化是将机器语言翻译给人看,而数据挖掘就是机器母语。分割、集群、孤立点分析还有多种多样五花八门算法让我们精炼数据,挖掘价值。这些算法一定要能够应付大数据量,同时还含有很高处理速度。3.1.1.3. 估计分析能力数据挖掘能够让分析师对数据承载信息愈加快愈加好
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 应用 解决 专业 方案
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【精***】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【精***】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。