大数据时代生活工作与思维的大变革PPT.pptx
《大数据时代生活工作与思维的大变革PPT.pptx》由会员分享,可在线阅读,更多相关《大数据时代生活工作与思维的大变革PPT.pptx(63页珍藏版)》请在咨信网上搜索。
1、大数据时代大数据时代-生活、工作与思维大变革生活、工作与思维大变革第1页一、认识大数据二、大数据时代变革三、大数据时代挑战四、大数据应用第2页+何为大?何为大?数据度量数据度量+1Byte=8 Bit+1KB=1,024 Bytes+1MB=1,024 KB=1,048,576 Bytes+1GB=1,024 MB=1,048,576 KB=1,073,741,824 Bytes+1TB=1,024 GB=1,048,576 MB=1,099,511,627,776 Bytes+1PB=1,024 TB=1,048,576 GB=1,125,899,906,842,624 Bytes+1EB=
2、1,024 PB=1,152,921,504,606,846,976 Bytes+1ZB=1,024 EB=1,180,591,620,717,411,303,424 Bytes+1YB=1,024 ZB=1,208,925,819,614,629,174,706,176 Bytes第3页+红楼梦含标点87万字(不含标点853509字)+每个汉字占两个字节:1汉字=16bit=2*8位=2bytes+1GB约等于671部红楼梦+1TB约等于631,903部+1PB约等于647,068,911部+美国国会图书馆藏书(151,785,778册)(4月:收录数据235TB)+1EB=4000倍美国国
3、会图书馆存放信息量第4页+天天有29402940亿亿封电子邮件发出,假如这些是纸质信件,在美国需要花费两年两年时间处理;+天天有200200万万篇博客在网上公布,这些文章相当于时代杂志刊发770770年年总量;+天天有2.52.5亿亿张照片上传至社交网站Facebook,假如都打印出来,摞在一起能有8080个埃菲尔铁塔个埃菲尔铁塔那么高;+天天有86.486.4万小时万小时视频被上传至视频网站Youtube,相当于不间断播放视频9898年年;+天天有1.871.87亿个小时亿个小时音乐会在流媒体音乐网站Pandora上播放,假如一一台电脑台电脑从公元元年就开始播放这些音乐会,到现在还没完没了地
4、接着放从公元元年就开始播放这些音乐会,到现在还没完没了地接着放;+谷歌翻译天天处理文字数量,天天翻译次数达十亿次十亿次,相当于一百万册图书一百万册图书,超出了全世界专业翻译人员一年一年能够翻译文字规模;+baidu天天关键词搜索量5050亿亿,谷歌33.333.3亿亿;+淘宝天猫双11那一天营业额达191191亿人民币亿人民币。中国小商品城整年成交额才580.03580.03亿元人民币亿元人民币;+累积起来,互联网一天之内产生信息总量,能够装满1.681.68亿张亿张DVDDVD光盘。+未来:物联网天天产生数据将会是海量。一、认识大数据(续)第5页什么是大数据?什么是大数据(big-data)
5、?人们并未形成统一认识,普通而言,它是指规模远远超出传统数据库软件处理能力海量数据集合。这一概念首要是针对信息化社会数据“爆炸式”增加,体量巨大而提出。对于数据多大能称之为“大数据”,业界并没有统一认识,通常认为100TB(太字节)是大数据门槛。简而言之,传统方法无法处理数据即为大数据。据美国政府预计,全球每年由各类设备产生数据到达约1.2ZB(1ZB=12亿TB)。若用1粒沙代表1B数据,1PB(相当于1000T)相当于1英里长、100码宽沙滩,而1.2ZB数据就如同一片浩瀚沙漠。一、认识大数据(续)第6页二十一世纪是数据信息大发展时代,移动互联、社交网络、电子商务等极大拓展了互联网边界和应
6、用范围,各种数据正在迅速膨胀并变大。互联网(社交、搜索、电商)、移动互联网(微博)、物联网(传感器,智慧地球)、车联网、GPS、医学影像、安全监控、金融(银行、股市、保险)、电信(通话、短信)都在疯狂产生着数据。“大数据大数据”诞生:诞生:半个世纪以来,伴随计算机技术全方面融入社会生活,信息爆炸已经积累到了一个开始引发变革程度。它不但使世界充满着比以往更多信息,而且其增加速度也在加紧。信息爆炸学科如天文学和基因学,创造出了“大数据”这个概念*。如今,这个概念几乎应用到了全部些人类智力与发展领域中。第7页+,图灵奖取得者JimGray,提出“数据密集型科学发觉(Data-IntensiveSci
7、entificDiscovery)”将成为科学研究第四范式,“数据科学”拉开了帷幕。+年,Nature杂志出版专刊,讨论大数据处理相关一系列技术问题和挑战。+203月底,美国政府公布了大数据研发专题研究计划(BigDataInitiative),拟投入2亿美元用于研究开发科学探索、环境和生物医学、教育和国家安全等重大领域和行业所急需大数据处理技术和工具,把大数据研究上升到为国家战略。+2010月,中国计算机学会于成立大数据教授委员会,并在2012月公布调研汇报,说明数据科学热点问题和发展趋势。第8页+3月29日,白宫公布美国政府大数据计划。+经过提升从大型复杂数字数据集中提取知识和观点能力,承
8、诺帮助加紧在科学与工程中步伐,加强国家安全,并改变教学研究。第9页10/2/我国应对我国应对 最早提出最早提出“大数据大数据”时代已经到来机构是全球著名咨询企业麦肯锡。麦肯锡在时代已经到来机构是全球著名咨询企业麦肯锡。麦肯锡在研究汇报中指出,数据已经渗透到每一个行业和业务职能领域,逐步成为主要生研究汇报中指出,数据已经渗透到每一个行业和业务职能领域,逐步成为主要生产原因;而人们对于海量数据利用将预示着新一波生产率增加和消费者盈余浪潮产原因;而人们对于海量数据利用将预示着新一波生产率增加和消费者盈余浪潮到来。到来。“麦肯锡汇报公布后,大数据快速成为了计算机行业争相传诵热门概念,也麦肯锡汇报公布后
9、,大数据快速成为了计算机行业争相传诵热门概念,也引发了金融界高度关注。引发了金融界高度关注。”伴随互联网技术不停发展,数据本身是资产,这一点伴随互联网技术不停发展,数据本身是资产,这一点在业界已经形成共识。在业界已经形成共识。“假如说云计算为数据资产提供了保管、访问场所和渠道,假如说云计算为数据资产提供了保管、访问场所和渠道,那么怎样盘活数据资产,使其为国家治理、企业决议乃至个人生活服务,那么怎样盘活数据资产,使其为国家治理、企业决议乃至个人生活服务,实际上,全球互联网巨头都已意识到了实际上,全球互联网巨头都已意识到了“大数据大数据”时代,数据主要意义。包含时代,数据主要意义。包含EMC、惠普
10、、惠普(微博微博)、IBM、微软、微软(微博微博)在内全球在内全球IT 巨头纷纷经过收购巨头纷纷经过收购“大数据大数据”相关厂商来实现技术整合,亦可见其对相关厂商来实现技术整合,亦可见其对“大数据大数据”重视。重视。“大数据大数据”作为一个较新概念,当前还未直接以专有名词被我国政府提出来作为一个较新概念,当前还未直接以专有名词被我国政府提出来给予政策支持。不过,在工信部公布物联网给予政策支持。不过,在工信部公布物联网“十二五十二五”规划上,把信息处理技术规划上,把信息处理技术作为作为4项关键技术创新工程之一被提出来,其中包含了海量数据存放、数据挖掘、项关键技术创新工程之一被提出来,其中包含了海
11、量数据存放、数据挖掘、图像视频智能分析,这都是大数据主要组成部分。而另外图像视频智能分析,这都是大数据主要组成部分。而另外3项关键技术创新工程,项关键技术创新工程,包含信息感知技术、信息传输技术、信息安全技术,也都与包含信息感知技术、信息传输技术、信息安全技术,也都与“大数据大数据”亲密相关亲密相关。第10页1.Volume2.Variety3.value4.Velocity结构化数据、半结构化数据和非结构化数据如今数据类型早已不是单一文本形式,订单、日志、音频,对处理能力提出了更高要求沙里淘金,价值密度低以视频为例,一部一小时视频,在连续不间断监控过程中,可能有用数据仅仅只有一两秒。怎样经过
12、强大机器算法更快速地完成数据价值“提纯”是当前大数据汹涌背景下亟待处理难题实时获取需要信息大数据区分于传统数据最显著特征。如今已是ZB时代,在如此海量数据面前,处理数据效率就是企业生命+“大量化(Volume)、多样化(Variety)、快速化(Velocity)、价值密度低(Value)”就是“大数据”显著特征,或者说,只有具备这些特点数据,才是大数据。大数据4V特征数据量巨大全球在 年正式进入ZB 时代,IDC预计到 年,全球将总共拥有35ZB 数据量第11页大数据=海量数据+复杂类型数据大数据包含:交易数据和交互数据集在内全部数据集海量交易数据:企业内部经营交易信息主要包含联机交易数据和
13、联机分析数据,是结构化、经过关系数据库进行管理和访问静态、历史数据。经过这些数据,我们能了解过去发生了什么。海量交互数据:源于Facebook、Twitter、LinkedIn及其它起源社交媒体数据组成。它包含了呼叫详细统计CDR、设备和传感器信息、GPS和地理定位映射数据、经过管理文件传输Manage File Transfer协议传送海量图像文件、Web文本和点击流数据、科学信息、电子邮件等等。能够告诉我们未来会发生什么。海量数据处理:大数据涌现已经催生出了设计用于数据密集型处理架构。比如含有开放源码、在商品硬件群中运行Apache Hadoop。第12页第一层面是理论,理论是认知必经路径
14、,也是被广泛认同和传输基线。第二层面是技术,技术是大数据价值表达伎俩和前进基石。第三层面是实践,实践是大数据最终价值表达。第13页大数据处理技术大数据处理技术让大数据能够为我所用,大数据时代终于开启了。第14页大数据与云计算第15页大数据与云计算云计算模式是业务模式,本质是数据处理技术。(肉体+灵魂)数据是资产,云为数据资产提供存放、访问和计算。盘活资产,使其为国家治理、企业决议、个人生活服务,是大数据关键议题,也是云计算最终方向。第16页假如将云计算与大数据进行一些比较,最显著区分在两个方面:第一,在概念上二者有所不一样,云计算改变了IT,而大数据则改变了业务。然而大数据必须有云作为基础架构
15、,才能得以顺畅运行。第二,大数据和云计算目标受众不一样,云计算是CIO等关心技术层,是一个进阶IT处理方案。而大数据是CEO关注、是业务层产品,而大数据决议者是业务层。第17页1.1.大数据比云计算更为落地大数据比云计算更为落地2.2.大数据不但仅是大数据不但仅是“大大”3.3.软件是大数据引擎软件是大数据引擎4.4.大数据应用不但仅是商业化服务大数据应用不但仅是商业化服务5.5.管理大数据管理大数据“易易”,了解大数据,了解大数据“难难”第18页l和数据中心(和数据中心(Data Data CenterCenter)一样,软件一样,软件是大数据驱动力,软是大数据驱动力,软件改变世界件改变世界
16、第19页第20页经过用户行为分析实现精准管理、科学决议和人性经过用户行为分析实现精准管理、科学决议和人性化服务是大数据经典应用,大数据在各行各业尤其化服务是大数据经典应用,大数据在各行各业尤其是公共服务领域含有辽阔应用前景是公共服务领域含有辽阔应用前景消费行业金融服务食品安全医疗卫生军事交通环境保护电子商务气象第21页 即使大数据是一个重大问题,真正即使大数据是一个重大问题,真正问题是让大数据更有意义问题是让大数据更有意义 当前大数据管理多从架构和并行等当前大数据管理多从架构和并行等方面考虑,处理高并发数据存取性能方面考虑,处理高并发数据存取性能要求及数据存放横向扩展,但对非结要求及数据存放横
17、向扩展,但对非结构化数据内容了解仍缺乏实质性突破构化数据内容了解仍缺乏实质性突破和进展,这是实现大数据资源化、知和进展,这是实现大数据资源化、知识化、普适化关键识化、普适化关键 非结构化海量信息智能化处理:自非结构化海量信息智能化处理:自然语言了解、多媒体内容了解、机器然语言了解、多媒体内容了解、机器学习等学习等第22页+大数据时代没有隐私爱德华斯诺登 第23页+70万人,无人通知在线试验,全球第一大社交网络脸书(Facebook)隐秘进行情感测试近日曝光天下,业界一片哗然。+,脸书(Facebook)幕后试验意在公测70万用户在面对对应NewsFeed中情感反应和行为引导。详细说来,脸书(F
18、acebook)在页面上人为设置一些正面或是负面情感性关键词,同时控制用户在自己NewsFeed中得阅读内容,从而观察用户在本身Post中得行为表示。经过大约一周数据搜集,脸书数据分析员能够观察到用户对于社交网络上情绪反应。对于70万用户情绪被消无声息如此操控,脸书(Facebook)行为无疑遭到了强烈指控。+脸书此次幕后试验曝光,是一个警醒明示。用户、互联网企业以及政府之间权衡,是一个当即也是长久去努力协作过程。在个人隐私和道德制约前提下,“大数据“时代,不是一个滥用数据时代,而是一个需要善用数据时代。第24页+大数据属于谁?第25页+数据独裁卓越才华并不依赖大数据,大数据扼杀创新。假如对不
19、可量化事物进行量化,我们将失去全方面了解该事物机会。第26页?第27页第28页第29页第30页+中国工程院院士邬贺铨说道,“智慧城市是使用智能计算技术使得城市关键基础设施组成和服务更智能、互联和有效,伴随智慧城市建设,社会将步入“大数据”时代。”+智慧政务+智慧交通+智慧电网+智慧教育+智慧医疗+依据国家信息中心信息化研究部统计,当前我国提出智慧城市建设城市总数已到达154个,预计投资规模超出1.51.5万亿元万亿元。智慧城市必将产生大数据,利用大数据思维来改变公共管理部门形象。第31页医疗可利用各种大数据伎俩医疗可利用各种大数据伎俩临床操作 1、疗效比较研究 2、临床决议支持系统 3、医疗数
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 数据 时代 生活 工作 思维 变革 PPT
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【精****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【精****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。