《POWERBI数据处理和分析》课件 第8章 数据分析基础.pdf
《《POWERBI数据处理和分析》课件 第8章 数据分析基础.pdf》由会员分享,可在线阅读,更多相关《《POWERBI数据处理和分析》课件 第8章 数据分析基础.pdf(67页珍藏版)》请在咨信网上搜索。
1、第8章 数据分析基础章节内容 8.1数据分析基本思想 8.1.1 Power Pivot中的数据表示模型关系模型 8.1.2 Power Pivot中数据分析建模基本思想 8.1.3数据分析核心概念1一一数据筛选 8.1.4数据分析核心概念2数据计算 8.2 DAX语言基础函数 821控制流/逻辑函数 822数据筛选基础函数 8.2.3数据统计/计算函数 8.3数据分析基础案例28.1.1 Power Pivot中的数据表示模型一一关系模型式 形 表 隹 二H A O 整据 数列 将干 是若 化和 构行 结干 的若 据了后成行。独 象构带张 抽型 数性干 象类个属若 对据每个成。类数,一 一的
2、 集 某列对象数二 中每 SW 界和 一界,来 世名的世象起 实列中实抽系 现的界现型 对列世的象列 示有实示对性 表所 1,表一森不同 型维普 类二据该据过 的而数是根通 同允,以 相性一值中可 在属。每段库又 具个构的字据但 据一结中列数,数的的0 列到表维的关存数含每得了二中在V38.1.1 Power Pivot中的数据表示模型一一关系模型 1.关系的基本概念 在Power Bl Desktop中,关系是指数据表之间的逻辑联系,这些逻 辑联系抽象自数据表所代表的现实世界中的客观对象。从形式上说,关系是通过两个表中具有相同意义的列构建的,通 常是分属两张表的两个列具有相同的名字和数据类型
3、。从作用上说,通过关系可以将两张表中的数据行关联起来,从而 将分属于两张表中的数据行合并为包含两个对象各自属性的一个 数据行。48.1.1 Power Pivot中的数据表示模型-关系模型从设置的内容上说,关系包括“基数”和“筛选方向”。基数是指已建立关系的两张表中每个数据行所代表的对象之间 的对应数量关系。筛选方向表示在两张表之间建立关系以后,以某张表为基础对 数据进行筛选时,对另一张表中数据的筛选效果。主要有以下 两种类型的筛选方向。58.1.1 Power Pivot中的数据表示模型一一关系模型基数类型(为表述方便,将两张表分别称为左表和右表以示区别)关系的基数类型含义示例一对一(1:1
4、)左表中的一个数据行,在右表中有唯一的 一个数据行与之具有相同的关系列字段值,反之也是一样。这表示两张表中数据行所代 表的对象有一一对应的关系。“房屋”表和“电量设备”表之间是一对一的关系。因为一 套房屋里只有一个电量设备,而 一个电量设备只能用于一套房屋。一对多(l:n)左表中的一个数据行,在右表中有多个数 据行与之具有相同的关系列字段值,而右表 中的一个数据行,在左表中只有唯一的一个 数据行与之具有相同的关系列字段值。“二手房”表和“小区”表 之间是一对多的关系。因为一套 二手房只能属于一个小区,而一 个小区可以包括多套二手房。多对多(n:m)左表中的一个数据行,在右表中有多个数 据行与之
5、具有相同的关系列字段值;而右表 中的一个数据行,在左表中也有多个数据行 与之具有相同的关系列字段值。“小区”表和“地铁站”表 之间是多对多的关系。因为一个 小区附近可以有多个地铁站,而 一个地铁站附近也可以有多个小 区。68.1.1 Power Pivot中的数据表示模型一一关系模型筛选方向类型关系的筛选方向含义示例单向假设筛选方向是从左表到右表 单向:在对左表的数据进行筛选时,会根据筛选留下的数据作为条件,依照关系,对右表的数据进行筛选;而反过来,当对右表的数据进行筛 选时,不会根据筛选结果对左表的 数据进行任何筛选。假设是从地铁站表到二手房表的单向关 系。则当对地铁站表进行筛选时,会根据筛
6、 选得到的地铁站信息,对二手房表进行筛选,则得到符合条件的地铁站附近的二手房。反 之,当对二手房表进行筛选,例如仅选择一 套二手房时,对地铁站表仍然使用所有数据 行,而不会仅留下该二手房附件的地铁站。双向无论对哪一张表的数据进行筛 选时,会根据筛选留下的数据作为 条件,依照关系,对另一张表的数 据进行筛选。假设是从地铁站表到二手房表的双向关 系。则对地铁站表进行筛选时,也会根据关 系对二手房表进行筛选,最后得到的是满足 条件的地铁站及附近的二手房信息。而对二 手房信息进行筛选时,也会根据关系对地铁 站表进行筛选,最后得到的是满足条件的二 手房及这些二手房附近的地铁站信息。78.1.1 Powe
7、r Pivot中的数据表示模型关系模型 2.自动生成关系单击Power Bl Desktop数据视图下“主页”选项卡中“管理关系”按钮,在弹出的“管理关系”对话框中单击“自动检测关系”按 钮Power Pivot则会根据四张数据表的列字段自动检测并生成这些 数据表之间的关系文件 主页 帮助 外部工具 I-1就信序由 B f s k a R,二 获取数据Excel Power Bl SQL输入数据Datave说最近使用的源 转换数据刷新 IS关系fl角色通过以下身份查看:工作簿髓集Server*剪喊 数据 赣 关系 安交88.1.1 Power Pivot中的数据表示模型一一关系模型管理关存可用
8、从:表(列)到:表(列)distance_met rob lock(block_id)block(block_id),distance_met rob lock(metrostation_id)house(block_id)house(metrostation_id)metrostation_gb(metrostation_id)block(block_id)metrostation_gb(metrostation_id)新建-I I 自动检测I I 编辐I 删除关闭98.1.1 Power Pivot中的数据表示模型一一关系模型looll留同 block合:distance metroblo
9、ck 6 block_idZ distance_to_metrometrostationjd折理人折有*blockjdblockname1metrostation_gbmetro_stationmetrostationjd小:*house G:Z area block_idZ buildingheightZ buildingyear direction equipmentZ hallsZ househeight metrostation_id折妻人*折星入108.1.1 Power Pivot中的数据表示模型一一关系模型 3.手工管理关系 如果Power Pivot自动检测生成的数据表之间的关
10、系不能满足数据 表之间的真正逻辑联系,则可以通过手工的方式进一步对数据表 之间的关系进行管理,包括关系的删除、添加和编辑等。通过点击“管理关系”对话框中相应按钮实现,也可以直接对关 系视图中两张数据表之间的关系连接线施加相应的操作。block 6:1 blockjd 1 删除blockname F属性I I -折蜃 2_ area block_id Z buildingheight Z buildingyeardirectionequipment118.1.1 Power Pivot中的数据表示模型一一关系模型对关系的管理和编辑还可以通过单击“管理关系”对话 框中“编辑”按钮,或在具体某个关系
11、的右键菜单中选 择“属性”菜单项调出“编辑关系”对话框实现。在“编辑关系”对话框中可以设置构建关系的数据表及 其列字段、关系的基数类型以及关系的交叉筛选器方向,此外还可以设置此关系是否可用(不可用的关系无法关 联两张数据表)。128.1.1 Power Pivot中的数据表示模型-关系模型X编辑关系选择相互关联的表和列。houseills toiletsareadirectionhouseheight buildingheightequipmentbuildingyearblock_idm12174.5南北37精装2008BK0042189.8南北77中装2009BK007Ml2179南北67
12、精装2013BK023Mlblockblocked blocknameBK001 当代洋新城BKOO2 新世金润家园BKOO3 月亮轩基数多对一(F)使此关系可用假设引用完整性交叉筛选器方向单一在两个方向上应用安全筛选器确定 I 取消138.1.2 Power Pivot中数据分析建模基本思想以一个简单的问题为切入点演示Power Pivot中数据分析的思路、过程和蕴含 的基本思想。1.问题 假设想了解一下二手房房龄对房价的影响,主观直觉上认为房龄越短的房子 应该售价越高,那么数据分析的结果是否可以验证我们的直觉是正确的?我们可以以某个年份(例如2010年)为分界线来区分房龄的新旧。然后分别
13、计算二手房每平米均价、2010年及之后的每平米均价以及2010年之前的每平 米均价并进行对比。二手房每平米均价度量值:每平米均价=AVERAGE(houseunit_price)148.1.2 Power Pivot中数据分析建模基本思想 2.CALCULATE 函数 CALCULATE函数是在筛选器函数对数据做过筛选的基础上,对数据进行 指定的聚合计算。CALCULATE函数的原型是:CALCULATE(,.)第一个参数expression是对数据进行的聚合计算表达式,不可省略。该DAX表 达式中包含着所引用的表对象/列属性,根据情况可以是隐式限定名或显式限定 名,当然这里的DAX表达式也可
14、以是一个已经定义好的度量值。除了第一个参数外的其他参数是对计算所依赖的数据进行筛选的筛选器函数,根据需要筛选器函数可以没有也可以有多个,每一个筛选器函数是在前面的筛 选器函数对数据做过筛选以后的数据集上进一步进行筛选。158.1.2 Power Pivot中数据分析建模基本思想 3.具体实现(1)创建度量值 首先可以使用CALCULATE函数建立两个用于分析新旧二手房价格 的度量值。房龄比较新的二手房的均价计算度量值如下定义:2010年及之后每平米均价=CALCULATE(AVERAGE(houseunit_price),housebuildingyear=20 10)2010年及之后每平米均
15、价二CALCULATE(每平米均KT,housebuildingyear=2010168.1.2 Power Pivot中数据分析建模基本思想房龄比较旧的二手房的均价计算度量值可以如下定义:2010年之前每平米均价=CALCULATE(AVERAGE(houseunit_price),housebuildingyear20 10)或者 2010年之前每平米均价二CALCULATE(每平米均 f,housebuildingyear20 10)178.1.2 Power Pivot中数据分析建模基本思想使用已有的度量值来定义新的度量值是一种比较好的做法,原因 在于:这样使得DAX公式的可读性更好,
16、比较容易理解;如果有多处DAX公式引用同一个已经定义好的度量值,则之前度量值如 果需要修改,只需要修改该度量值定义。如果不这样做,则一旦该度量 值对应的子公式需要修改,则在引用它的每一处地方都需要做到无遗漏 的修改。188.1.2 Power Pivot中数据分析建模基本思想(2)度量值结合可视化对象进行数据分析在报表中添加一个簇状柱形图,设置“每平米均价”、“2010年 及之后每平米均价”、“2010年之前每平米均价”三个度量值为 该簇状柱形图的“值”属性。竭图锢E曲|I 8 I 0及卜A管理关系 新建度量值快度量值新建列新建表 二改卷.一K 管理角色通过以下身份查看:问答设置 语言语言架构
17、关系 计算 页面刷新 在以下情况下会怎么样 安全ft 问答 人V RH帽渝 由 黑可视化 lapyffi 0 Q R 0 295f?2字段|Q搜索U国2000年后每平,0 2010年之前每-0 2010年及之后 Z area blockjd C Z buildingheight O Z buildingyear沏加之S53*坨/.20100523络率一%皿名百切困口 一 MUHQO唱2m o 在此处添加数据字段 directionZJ equipment Z halls Z househeight metrostationjd Z no Z rooms198.1.2 Power Pivot中数
18、据分析建模基本思想通过对不同装修程度的二手房再分别对比新旧房龄二手房的价格 影响,进一步探索分析。在报表中再添加一个簇状柱形图,除了 仿照第一个簇状柱形图设置“值”属性外,再将装修程度设置到“轴”属性上。13 19 house-Power II Desktop 寰录一 X文件 主页 插入 建模 视图 帮助 外部工具 格式 数据/钻取国辑1 E H 型/Q管理关系 新建度量B快度量值新建列新建表 更改检消 孙建叁数 管理角色通过以下身份查看关系 计比 田面电新 在以下1W次下会怎么样 安全性触 _ y S3.:第2页供2页)配星用国巨 ElpyISR Q 摩跑因S I g E 可臣一IHQ园唱
19、V 爵 字段|不搜索U U 2000年后母平 日 2010年之前每,Q 2010年及2后 Z area block.id Z building heightO Z buildingyvar direction3 equiPment 八)Ngment=20 10)首先,该度量值的DAX公式定义给出了所使用的数据表及其字段,即“house表中unit_price字段,而筛选器函及“housebuildingyea门=2010给出了原始数据的第一次筛选。298.1.3数据分析核心概念1数据筛选首先将该度量值应用到卡片图在默认情况下,卡片图只需要设置“值”字段属性,在没有其他筛选器的作用下,该度量值与
20、卡片 图结合给出了数据表中所有2010年及之后建造的二手房的每平米 均价数据,这里平均值计算函数AVERAGE。所基于的筛选器上下 文就是由度量值自身DAX公式定义中的筛选器函数决定的。a搜索34.79 千2010年及之后每平米均价此视觉对象上的筛选器2010年及之后每平米 是(全部)toilets等于2筛选类型。昌皿复处因日 唠目区 易匿困唱口目,官T/Iflfl解困囱巨曲叩曲基本筛选字段回金 10 2 3 436758841512010年及之后每平米均X钻取跨报表318.1.3数据分析核心概念1数据筛选将该度量值应用到柱形图视觉对象。将装修程度设置为柱形图的横轴字段后在柱形图上便 显示出2
21、010年及之后建造的二手房根据不同装修程度分类的房屋每平米均价数据,依横轴 展开的每个柱形所代表的数值实际上都是根据分类轴字段equipment的值又对数据行进行 了一次筛选。例如“豪装”所对应的柱形数值41千是将满足筛选条件equipment一豪装”的数据行留下,再根据DAX公式定义中的筛选条件housebuildingyea=2010对数据做进一步筛选,最后对 这些筛选得到的数据行中的unijprice字段求平均值得到的。在本次应用中,除了DAX公式 外,还依据横轴字段对数据进行了筛选。V K序血随困回巨Ml曲回pyR 政 疯陋屈Rd e M6区园台 号 时lafl凶目Bfflr 可匡史屈
22、唱2-equipment图例在此处添加数据字段X/X轴值2010年及之后每平米均X328.1.3数据分析核心概念1数据筛选将该度量值应用到矩阵对象。将该度量值设置为矩阵的“值”字段,将“装修程度”字段 设置为矩阵的列字段,将计算列“房型”字段设置为矩阵的行字段后,可以得到对于每种 房型按照不同装修程度的每平米均价数据,并且在行和列方向上还有汇总计算结果。该矩阵对象中的每个数值都是由矩阵的行和列筛选器函数、DAX公式的筛选器函数共同构造 的筛选器上下文对house数据表中的数据做过筛选后的数据计算得到的。1房1厅1卫1 1房1厅2卫1房2厅1卫|2房1厅1卫|2房1厅2卫|2房2厅1卫2房2厅2
23、卫|3房1厅1卫|3房1厅2卫|3房2厅1卫3房2厅2卫I简装 精装 毛坯 中装 总计28,918.6039,140.0 046,0 66.673 0 5 53 Q 3.548,90 0.0 0 24,462.9632,80 0.0 031,10 0.0 0 25,600.0 026,544.0 024,242.1125,950.0 029,371.8630,385.2331,516.6729,352.3828,466.6728,988.8928,0 46.1531,735.4231,100.0028,632.1550,257.1430,498.4629,230.7730,189.6634,7
24、46.12血窿国回亘屋曲。回pyR 武 史后区公圜旨亍 曲心百苧fflD 3 一三 基也回Q国T为 崩序雕4房1厅1卫 4房1厅2卫1 4房2厅1卫4房2厅2卫I 4房2厅3卫4房3厅2卫|5房1厅1卫|5房2厅2卫5房2厅4卫 总计39,90 0.0 0.00,0033,56,0037,60 0.0 041,433.33 27,502.0138,200.0 0 37,333.3327,133.33 29,20 0.0 0 31,640.0028,352.94 27,871,43 25,40 0.0 0 28,164.5239,354.90 31,577.0 5 48,150.0 0 35,1
25、10.9438,550.0 0 44,90 0.0 0 45.181.8216,90 0.0 0 16,900.0037,600.0027,70 0.0 0 24,40 0.0 0 26,600.0027,40 0.0 0 27.400.0033,119.84 28,962.97 30,720.00 31,117.79房型equipmentV总行列值2010年及之后每平米均彳X338.1.4数据分析核心概念2数据计算在数据筛选的基础上对量化指标的DAX公式计算通常是按照先产生/提 取每行指定的字段值,然后按照数据表遍历每一数据行聚合计算所需 要的指标值,对数据的计算隐含了对数据表的自动循环遍历
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- POWERBI数据处理和分析 POWERBI数据处理和分析课件 第8章 数据分析基础 POWERBI 数据处理 分析 课件 数据 基础
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【曲****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【曲****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。