《POWERBI数据处理和分析》课件 第3章 数据处理基础.pdf
《《POWERBI数据处理和分析》课件 第3章 数据处理基础.pdf》由会员分享,可在线阅读,更多相关《《POWERBI数据处理和分析》课件 第3章 数据处理基础.pdf(26页珍藏版)》请在咨信网上搜索。
弟3早 数据处理基础章节内容 第3章数据处理基础 3.1数据的清理 3.1.1文本编码的处理 3.L2异常数据值的处理 3.L3行列数据的简单处理 3.2基本数据类型数据的处理 321文本数据的处理 322数值数据的处理 3.2.3日期时间数据处理 3.3高级类型数据的处理2第3章数据处理基础在将数据导入到Power Bl Desktop中之后,为了将导入的数据整理成为适合于 存储和分析的状态,需要对数据进行进一步的处理。在“主页”中使用“转换数据”按钮将当前的数据表使用Power Query查询 编辑器打开进一步处理,从导入数据到进行数据处理的每一个操作步骤都会 被查询编辑器记录下来,以后当数据源发生变化之后,则可以通过“转换数 据”按钮右边的“刷新”按钮重新读取数据源,并自动执行保存下来的处理 步骤。文件主页3 获取数据帮助外部工具表工具质Excel工例 闻输入数据 国 Power Bl 数据集 Dataversefe SQL Server e最近期的源v转换数据刷新I f El新建度量值快度量值新建列新建表馥角色通过以下就查看:安担字段哪狼使用Power Query编辑器来连接、准备和转换数据.Ai x y)3第3章数据处理基础 Power Query查询编辑器的主要界面由“主页”、“转换”、“添加列”、“视图”、“工具”以及“帮助”等几个功能选项卡构成;当完成数据处理工作后,可以使用“关闭并应用”按钮,将对导入数据表的 具体处理步骤记录并应用,并将最终的处理结果数据表保存到当前pbix文件 中。H 无标题-Power Query编粗器主页 转换 添力叫IJ 视图 工具 帮助文件产合并查询,I追加查询,0合并文件二岛岛口京出片:,器关闭并新建最近使输入数据源管理 局新二小再 应用,源,用的源,数据 设置 参数,预览,总评,关闭 新建直询 数据源参数 直询*X 选择删除 列,歹卜管理列日-1 J _L zj保留删除 行,行.减少行 排序.二数据类型:文本,将第一行用作标题,拆分分组1誉的消 列,依据,替换值转换组合三文本分析O视觉A Azure机器学习AI见解43.1.1数据的清理一一文本编码的处理在获取数据时,如果没有设置正确的文本编码,常常会导致乱码问题,通过 识别和设置正确的文本编码可以解决乱码。bookdata.c sv文件原始格式 分隔符936:简体中文(GB2312)逗号数据类型检测n i基于前2oo行,1 X i涔Tt绢桢塔健限埔涔坏螺?,到植培濯?稣爆坏敛虹地徽润蝮虹增纳?,籍1乂A辘 细握海丽功潴床 獐昏俑:绢惧配海 垛null34.6482018/05/08泪浓濡冏虹增名缩的解镰舵极博伟苦撑杆很6.914.9927.539.92018/04/20缱始 螺苑液路鳄一数罪?,5null591182018/03/29璐秋容浜烘哥蝮虹增W楂棒在姝讳筒U!516.9829.959.92018/04/01温鲂籍焯黜1岁孑婶唉激辩殖觥城档园在理壮I筑劲.null18362018/03/01线桶含墀喟伐澧y n稣籀?,5null24.949.82018/05/01漕+触浜烘肝蝮虹增势的致辙涔崩曝寅姆行濒辨撷涓表筒涓怒钩奉歌舞姝?.null30382018/04/09饿榆台海肉恪蝮虹增i寤驻铸帆:绛媾诲蝌涧|浜?,51819382018/03/01娃煽馍囊魁囱那$源上婢然 渲4嗖镰?,5null21422018/05/01涓泳道村会鳗虹域场浣和假涔场曝浜蟒好涧渝信辘杈洸嫌锯?,512.9919382018/04/01馔澳底螺囱里竣虹增1锲新潮座何缭兼直雄?,527.9924482018/01/08涓泳皤村效雄虹域9潼绘壁徽堕祝陵勘汉2饼翻案飙棍劄柒?,512.9919382018/04/01瓣捐始期义构筑哄篇(I SPY瑙呜 演y盘鳌?,6.8null107.1158.42018/05/01相二姐行虹增组?,0线诲激变黜6.9null33.1482018/04/01激伏出冰憎爷K9儿洸7.512.9974.999.92018/03/01娓量盘浜虹收7.512.9931.5422018/04/01浜虹被撞鎏?,5null641282018/02/01涓俊短虹增兆?,98.(漕辨釜箱励口新?,524.9924482018/03/01谯梯含漏旃情成虹堵f税式蚓涓沿泪幕眸猫副口家情细汨赛喋杞伙纤涓.null19382018/04/01朗换羚蝮虹增绢?,98.三潘涉港瑞惧钩级理樵%颁制浣泊漆铝间宽布?,5.5null32.5592018/03/01浣激跋虹墙州?,98二V1使用示例樨取衰I|加载|转换数据|取消 X bookdata.c sv文件原始格式分隔符数据类型检测65001:Unic ode(UTF-8)逗号基于前200行|使用示例提取|H名折扣电子书价格折扣价原价出版Fl期推荐度六妈罗罗新书从容养育:成长自我,成就孩子7.2null34.648100半小时漫画世界史6.914.9927.539.996.6神奇校车动画版5null5911898高兴死了川516.9829.959.9仪式感:把将就的日子过成讲尢的生活5null1836听你的5null24.949.8我这么自律,就是为了不平庸至死7.9null3038姑娘,你活得太硬了5181938孤独是种大门在5null2142你那么懂事,二定很辛苦吧512.991938,炼成的527.992448才找时间的人2:永恒之地512.991938I SPY视觉大发现6.8null107.1158.4医学就会6.9null33.14899.1小上了二部曲7.512.9974.999.996.6清例人生7.512.9931.54299.8人类简史5null6412898.6失踪的女儿524.992448100做一个市境界的女子:不自轻,不自弃5null193898.3山本贾平凹海峰之作震撼上市5.5null32.55998.3V别让好脾气告了你5null19.939.899.7加载|转换数据|取消|5.民.2018/5/1天津人工大学.2018/3/1北京理凰文艺.2018/4/1江苏凤民.2018/3/29贵州人展文艺.2018/4/20江苏凤女.2018/5/8中国妇2018/5/1接力.艺.2018/4/1百花洲文公.2018/1/8中国致补2018/4/1四川文艺出版公.2018/5/1中国致艺.2018/3/1江苏风凰文有限公司2018/4/9北京联合出版民.2018/4/1贵州人家.2018/3/1作岛.2018/4/1吉出版右限公司2018/3/1北京联合信.2018/2/1中民.2018/4/1天津人生.2018/3/1文文献.2018/4/1科学技术3.1.2数据的清理一一异常数据值的处理导入的数据表中可能会因为各种原因有一些缺失值或错误的值,为了数据建 模分析的需要,要使用有意义的值替换这些异常的数据值,或者简单的过滤 掉这些异常的数据值。,例:导入并处理有关学生信息的EXCEL数据表格数据(studentdata.xlsx),可 以看到该表格中有缺失的成绩,可能是学生没有参加该门课程的考试造成的,止匕外,表格中还是用了单元格合并等格式,因此,当导入该表格数据后,使 用Power Bl编辑该查询,可以看到格式和缺失数据造成了很多缺失值。1231569101112 1314 151617IS19ABCDEF学号姓名院系C业高数英语体育192120181物理 物理学909575193182108将煤电了一微电子858080IH518012K孙权电子-通信1.程7685197183201诸葛亮电子 通俗工程959080193225177关羽计算机-计算机7090198180601张飞电r-微电子6()8595191180668超云电子通佑工程909095195820165黄忠信管-图书859585193820550张辽社会-社会学909088r.i2j学2展姓幺EJ网宏至?业 .内 Aft g!不出区内1192220182 刈多的5!.比790952nuH nullnuU3293282208 l|S电小一电,85804nu nutftu)f5285180128 斗 M电了-通工人ma 766nun nulltu)fluff7197183201篇乏元*1通号工在9590anuK nuHna(iq;9.W5;77 关羽机.70nattWfiuN nut:nMnuU11196180602 E电子徜电子60SS12nullnuH nullfu!nud131911806S 小公电子通巧1程909014nullnuH nuHnu!nutt15195820165 M S859516oulnuJl nullouifnuit17293820550 KK社会-社会?909018futlnuN nuKma19nuHnu9 nuitrtufl/wffX)nullnun nuit0ul!naU?1nu!lnun nullOiif63.1.2数据的清理一一异常数据值的处理(1)删除异常的数据值对于因为EXCEL表格格式造成的全是空值的行,直接采用删除的方法去除掉。可以通过主页中“删除行”按钮下拉菜单中的“删除空行”完成删除操作,也可以通过在表格中任何一列右上角的三角箭头下拉菜单中选择“删除空”菜单项实现删除操作。L_ 一输入数据京国昌数据源管理 刷新 设置 参数,预览,数据源参数属性 I JgB L|j匚,高级编辑器 一 K;一L竺工团 选择删除 保留删除醯.列,列.行,行,查询 管翁删除最前面几行n 儿排序数据类型:整数,F合并查询,一三j将第一行用作标题,黑追加查询,赞S 替换值 合并文件转换 组合三文9视Aa;fx=T able.SelectR ows(更改的类型J,:聊1险间隔行学号)Vn.123学号 既姓名 小删除重复项123 高教|二|123 英语|二 123,1192120181刘备 国1删除空行90952193182108曹操 1从此表中删除所有空行。185803185180128Jnull76J W,14197183201诸葛亮电子-通信工程95905193225177关羽计算机-计算机70null6198180601张飞电子-微电子60857191180668赵云电子通信工程90908195820165黄忠信管-图书85959193820550张辽社会-社会学909073.1.2数据的清理一一异常数据值的处理(2)将异常的数据值替换为特定值将缺失的学生成绩替换为0是比较合理的,也可以方便后续的数据分析。在 表中任何位置单击,然后按CTRL+A选中整个表格,在主页中选择“善换值”按钮,在替换之对话框中设置将空值替换为0。添加列 视图 工具 帮助s a S输入 数据源 管理 数据 设置 参数数据源 参数刷新预览哈属性Zb高级编辑器查询5 X选择删除歹1J 歹U 管理列保留删除 行.行减少行排序数据类型:任意 国 合并查询,三 文一将第一行,作标题.1追加查询,9视 黎3发h替换值1 W合并文件AA2转换 组合fx-Table.Selec tRows(更改的类型,eac h 学号 null and 学号*)直 73学号 姓名 三人%院系专业 E和3高效 i23英语1 192120181刘备 物理物理学 902 U1877C8的接 市孑.衢市于 854:替换值5 1,在所选中,将其中的某值用另一个值替换.6 17 1 要查找的值 _8 1 null9 1 替换为I。I臼岛,95 fin X I确定|聊肖|83.1.3数据的清理一一行列数据的简单处理 L将首行数据提升为标题 Power Bl Desktop在导入数据时会尝试区分并识别可能的列名,在有些列名存 在但是无法区分列名和数据的情况下,列名会被识别为数据的第一行,此时 生成的数搪表的歹。名由默认的c olumn、c olumn2o o o等形式命名;可以在Power Query编辑器中使用“将第一行用作标题”按钮来把数据表的 第一行提升为列名。文件颈 转换添力咧 睡 工具帮助二 R一 口同 二培属性 乂 青聋2【I数据类型:文化_并酗w个 以高级编辑器 U 1二将第一行用作标题,工追加查询,关闭并痂1最近使输入物g源韶 刷新二廿佃 解删除 保留删除 粉分组h卷油咕.-灶应用,源,用的源,数据 设置 皴卜预览,目比 列,列,行,行,列,槌”酶值关闭 新建查询 数据源参数 查询 管理列 减少行 排序转换组合查询口1bookdatafx=T able.T ransformColumnT ypes(源,Column1j厂 Abc Columnl abc Column2将第一行用作标题将此表的第一行提升为列标)e text),Columns,type text),abc Column4 以 abc Columns1书名折扣电子书价格折扣价原价2六妈罗罗新书从容养育:成长自我,成就孩.7.234.6483半小时漫画世界史6.914.9927.539.993.1.3数据的清理一一行列数据的简单处理 2,修改数据列的数据类型在导入数据时,Power Bl Desktop会尝试识别每一列数据的数据类型如果白 勰麴耕类”懑足要求:则可以通过鼠标庖吊翳 酒糯 及掘大型陶示,倜出配据类型设亶菜单并手工设置来进行修改。fx=T able.T ransformColumnT ypes(提升的标题,书名type text),折扣”,type number),“电子书价格”typeV匚,2c书名 E12卜扣12电子书价格12折扣价12原价1六妈罗罗新书从容养育:成长自我,成就孩.方小数7.2null34.62半小时漫画世界史$定点小数 123整数%百分比 场日期/时间 制日期O时间翅日期/时间俐区6.914.9927.5A3神奇校车动画版5null594高兴死了!!516.9829.95仪式感:把将就的R 了过成讲究的生活5null186听你的5null24.97我这么自律,就是为了不平庸至死7.9null308姑娘,你活得太硬了S持续时间518199孤独是种大自在ABc文本5null2110你那么懂事,一定很辛苦吧 T rue/F alse512.991911国家是怎样炼成的同一进制527.9924123找时间的人2:永恒之地使用区域设置512.991913I SPY视觉大发现6.8null107.1103.1.3数据的清理一一行列数据的简单处理 3.删除行从数据源导入的数据中,会因为各种情况导致有一些数据行是不符合需要的,这时可以使用“删除行”功能对指定的数据行进行删除操作。Power Query中通过“删除行”功能按钮的下拉菜单提供了不同的对数据行 进行删除的选择,包括“删除最前面几行”、“删除最后几行”、“删除间 隔行”、“删除重复项”以及“删除空行”等。.73、号.切 1 nx H选择删除保怕谢除 列.列.行.行.类型.整数?合并佥询一将甯一行用作标息 T迎K直询瀛 替换值”合并文怜转授 用合管二和除却此店 花查问0fx=Table.TransformColuimTypcs(i!i瞬最后几行1冷向S8行M.Typ*,幢,type text,院条、业,tyffH bookdataL.再”史因”名H-r到除星复或二J/3高数 日:内英诣-Shp0tl|1 192120181 刘各理知源空行90 952 nuUR剿蝌敝nutt nuff nuU3 193182108 种慢85 804 mrUnuUnutt nuH nuHS 185180128 孙权nuN 766 nullnuUnutt nuH nuH7 197183201 诺葛克电子-汕信工程95 908 nuUnuUnutt nuH nuU9 193225177 关羽计算机TH机70 nuU10 mrilnullnutt nuH nuH删除间隔行推定要删除和保留曲亍的模式.要删除的第一行2要那蚯石数1要维SB曲亍数Ar站名192120181193182108185180128197183201193225177198180601191180668195820165193820550,ac院系。业1%英丽X删除最后几行指定要删除最后多少行.|TOM|113.1.3数据的清理一一行列数据的简单处理导入的数据表中,可能有一些属性列是重复多余的,或者是后续分析不需要 的,此时可以通过“删除列”或者“删除其他列”功能实现对不需要的属性 列的删除。添加列 视图 工具 帮助E 不、限属性彳33K级编银器 怆入数据源管理 刷新一钱醐.数据 设置 叁数,预览,M列.1T 51 M 数据类型:文本,I H 将第一行用作标题,蝴除 保留删除 拆分分组12s的1列行。行,列。蹴4替换值数据源参数 查询管理列 减少行 排序 转换合并直询,工追加查询,刊合并文件组合i35转换添胸嫄 TS 帮助-X个关闭并 应用”新建 源,品近使 用的源.汪增入La数据源省理 参数,预览,宅属性二管理,列.X删除 列,当已21 a1*1列.分组依娓数据类型:小数二将第一行用作标题.替换值三合并用0,7追加直询,三合并文件叁文本分析A Azure机器学习保忸 行.后除 行,关闭数据源参数查询管理列减少行排序一换组合Al Wfx=Table.TransformColumnTypejX|选择列,typeL.2c 附12 41-1L2块仰1 六妈罗罗新书从容养育:成长自我.成就孩.诜怪琴保留的列34.62 半小时漫画世界史 画27.53神奇校车动翻版594 高兴死门II 29.95仪式修:把将就的口子过成讲究的生活186所你的24.97我这么自律,就是为了不平盾至死308姑娘,你活得太硬了199孤独是种大自在2110你那么懂事,一定很辛苦吧1911国家是怎样炼成的2412力找时间的人2:永恒之地1913 1 SPY视觉大发现107.114医学就会33.115小王子三部曲74.916清单人士31.517人类简史6418失踪的女儿2419做一个有境界的女子:不自轻,不门弃19芦询2bookdataT1 Sheet1fx-Table.什2心化5(:。11由丁丫。$(提汗的标明(竹土,type text),折叶,type number),价格”,type number),折扣价”,A*L2折扪 12电子V价卜二角制回L2原价Lrjnr出版匚1六处岁岁新V从容不自:成长自我,成双孩7.2x剜除34.6 48A21*小时漫画世界史6.9剧除其他列27.5 39.93神奇校车动他版5重鱼列59 1184高兴死川!5E从示例中添加列29.9 59.95仪式感:把将就的口子过成讲克的生活5则除重发项18366听你的5剧除错误24.9 49.87我这么自律,就是为了小中庙生死7.9更改类型30388姑娘,你活得太硬r5转换19389孤独是林火自在5U/替换值214210你那么怪事.定很辛苦吧5替换错误193811国家是意料炼成的5口分组依分244812不找时间的人2:水包之地3填充193813ISPY视觉大发现6.8少逆透视列107.1 158414医学就公6.933.14815小干了三处西7.574.9 99.916清单人生7.531.54217人类检史56412818失嫁的女儿5【为新含询添加24 A819做一个有境界的女子:不白辑.不自弃5193820山本荒平”峨峰之作盛括上市 5.5null32.55912R评论效作者推荐度.出版日期原价折扪价V电子书价格B折扣B书名(选择所有勉搜索列3.1.3数据的清理一一行列数据的简单处理 5.添加列出于后续数据分析的需要,有可能需要根据当前数据表中的某一列或者某些 列生成新的属性列,例如生成索引列、提取日期中的年、月、日等分量生成 新的属性列等;在Power Query的“添加列”选项卡中,通过各种功能按钮提供了丰富的生 成新的属性列的方法。文件主页 转换 添加列 视图工具帮助示例中自定调用自定 的列,义列义函数晶斛例,索引列,启重复列下/-合并列xa oa in2/三角函数,raC y nn 10 nn一徵提取,1 HU g舍入,格a1KA诉.统计标胖胆产自,式,/分析信息,准,记数,阳信息日 时持续 文本视A zure机 期,间,时间,分析觉器学习常规从文本从数字从日期和时间A I见解01三 A133.1.3数据的清理一一行列数据的简单处理 5,添加列一一案例将学生信息表中的学号和姓名两列合并为新的一列,并且规定学号和姓名之 间使用符号“,作为分隔符,则可以选中学号和姓名两列,然后使用“添加 歹厂,中的“合并列”功能按钮,通过在合并列设置对话框中设置好分隔字符 以及新的属性列的名称,就可以实现通过合并列来生成新属性列的任务。添加列 视图 工具 用助制领 展台并列|皆 0,三角函数产)=0 A索引列 比提取工w 牌舍入 匕aW 5ll 格二。柘.统计标科学 门口.日 时持续 文本视Azure机式.斫信息准,记数,信息 期,间,时间分析觉器学习从文本 从数字 从日期和时间 AI见解/A Table.RenoveLastN(JH 除的间隔行,2)v二看3学号 pc好名 G业 臼论政 区内 英诳 官一介1 192120181刘番 物理.物理学 90 952 193182108科操 电子澈电了 85 803 1851801284枚 电子-通信工程 null 764 197183201 诸克 x I5 193225177 关羽 合并列6 198180601 强 K7 191180668 赵云 选择已选列的合并方式.8 195820165黄忠 分隔符9 193820550 张 1Z I.自定义.一 71新列名何选)学号姓名确定|嵋|143.1.3数据的清理一一行列数据的简单处理 6.拆分列可以通过“转换”选项卡的“拆分列”功能按钮,根据指定的规则将已有的 数据列拆分为若干列,所生成的新的数据列的数量取决于原始的属性列的数 据和拆分的规则。案例:前面生成的“学号-姓名”属性列,因为是文本类型的,则可以设置 拆分规则为根据分隔符号“-对原有的属性列进行拆分,这样就得到了“学号,和“姓名”两歹越主页转换添加列腱工具帮助 L 0转置 数据类型:文本 M替换值展逆透视列庄反转行-检测数据类型于填充工移动,濯器部日对行进行计数重命名 2透视列 转换为列表I表格 按分隔符 L因 列.展T合液锡提取 3靶分析,文本列限噩1。二二函数,-0 0 R Py统计标科学 日 时持续运行R运行Python自息,准记数,庭:信息,期,间,时间,雌 脚本编号列 日期&时间列 脚本查询2 fx-Tab按分隔符折分列%”,eac h 丁”七0|1)汨(1*七0111(学号,2卜11),姓X,type text)vbookdata院系专业基于指定的分隔符,拆分所 选列中的值.按照从大写到小写的转接讲 内体白 T生日氏学号姓名 nSheetl1钟.-物理学95752001/3/1192120181-刘备2,.微电子技字到非数钿转换 按照从非数字到数字的转换80802000/10/28193182108曹操3,通信工程76852000/12/20185180128-孙权4k 通信工科90802001/5/18197183201诸葛亮5算机计算机7C)null902001/6/7193225177关羽6R微电子6C)85952001/1/1519818060卜张 t7了 通信i.e9C)90952001/7/8191180668赵云8管-图书8s95852000/9/30195820165-黄忠9会-社会学9C)90882000/11/16193820550 张近 153.1.3数据的清理一一行列数据的简单处理 7.调整列的位置出于处理或者观察的方便需要,可能需要调整数据表中各个属性列之间的位 置关系,首先选中需要调整位置的属性列,然后可以通过以下三种方法移动 属性列的位置:1)通过“转换”选项卡的“移动”功能按钮,如图3.19所示;-2)在选中列上单击鼠标邮件,在弹出菜单中选择“移动”功能菜单;-3)直接用鼠标左键拖动选中的属性列到所需的位置后释放鼠标按键。E9痂转换添阚睡工具帮助分组将第一行依据用作标懑,自转置窠反转行旧对行进行计数表格查询 2I L bookda:a 产 Sheetl0 R持续 运行R运行Python数据类型:小散一如替换值:、-逆透视平 屋 合并列 XO 2 三角函数,一检窝数据类型叵填充巨电三|,雷提取,呼 三:舍入i重命名 三金丽会 雅 复J分析-蠹.1黑.建信息任邛向右移动 文本列 编号列0移到开头A-Table.T _(也;,:;,type text),lr III,type number),“电 jT;|M,type number),“川价,4楼到末尾 _.一时列表a期.间,时间 脚本日期&时间脚本脚本L 2c1名 将此列移到表的末尾.1 12圻扣-12电子廿价格1.2折拉价 臼-J ft价MFln出版i1 八妈职罗新书从仃乔H:收改门也,吹观忸.7.2null34.6482 半小时漫画世界史6.914.9927.539.93神奇校车动画版5null591184高兴死了川516.9829.959.95仪式麻:把将就的日TH成训兄的生活5null18366听你的5null24.949.87我这么自律,就是为不平庙至死7.9null303s8姑娘,你活得太硬了5181938163.1.3数据的清理一一行列数据的简单处理 8.填充属性列当从EXCEL文件等类型的数据源导入数据表时,由于原始文件中合并单元格 显示等格式控制的原因,会导致属于同一类别的多个数据行连续在一起,但 是其中只有一个数据行的相关属性列具有值,其他数据行的同一属性列的值 为空值,这时可以通过“转换”选项卡中填充功能,将连续在一起的属于一 个类别的多个数据行的类别属性列的值填充为已有的值。文件主页 转换添加列 视图 工具 帮助数据类型:文本替换值;-逆透视列一 一检测数据类型丁填充一|后移动一件二|台转置_ eg反转行#1合并列 xo DS-n2,三角函数,微提取 Z/*梵舍入,谶彘藕加谢钳数日重命名巴F-周转换为列表 冢&哈分析,&菖 需.;信息,表格 将单元格中的值向下填充至 文本列 编号列杳、旬nl,当前所选列中的相邻空单元格内。tRows(更改的类型,eac h not List.IsEmpty(List.RemoveMatc hingItems(Rec ord.Fi-bookdata巨123学号Abc姓名A%院系专学H Sheetl1185180128孙权电子Sheet22197183201诸葛亮null3191180668赵云null4193182108曹操null5198180601张飞null6193225177关羽计算机7193820550,辽null8192120181如怖物理9195820165黄忠null173.1.3数据的清理一一行列数据的简单处理 9.行列互换对于有些数据表,可以从行列两个不同的方向进行结构化,因此可以通过行 列互换功能,在需要的时候将列转换为行,从而适应不同方向数据分析的需 要。实现具体的处理步骤是:1)将标题降为第一行数据-2)通过“行列转置”功能实现行列互换 3)再将第一个数据行提升为列标题183.2.1文本数据的处理 L文本替换 案例:通过文本替换去除多余文本。首先选中“评论数”属性列,然后使用“转换”选项卡的“替换值”功能按 钮,在“替换值”对话框中,设置要查找的值为“条评论”,替换为就保留 为空,这样就实现去掉“评论数”属性列中多余的文本了。接着只需要将该 列的数据类型修改为整数类型即可。E9韧转换勘口列视图工具帮助3.2.1文本数据的处理-2.提取文本数据 可以通过“添加列”的“提取”功能按钮提取已有文本类型的属性列中的文本生成新的属性列。案例:通过“学号”列数据提取学生的入学年份,在学号中入学年份是固定的前两个字符。先选中“学号”属性列,然后选择“提取”功能中的“范围”菜单项,在对话框中设置提取的首字 符位置为索引0(在Power BI中文本第一个字符的下标是0),然后字符数为2,就可以提取入学年 份生成新的属性列。视图 工具 常助6 A.123学号fx-Table.FillDown(,:,孙权诂葛亮提取文本范围日 时 持续期,间,时间从日期和时间文本 视 Azure机分析 觉 器学习AI见解abc院系专业电子电子输入首字符的索引,以及要保留的字符数。起始索引203.2.2数值数据的处理(1)根据已有的列计算新的列 对于导入的学生信息表,根据已有的各门课程成绩,计算每个学生总分。首先选中所有的课程成绩列,接着通过“添加列”选项卡的“统计信息”按 钮的下拉菜单选择“总和”,实现计算并添加总分列。35 转换 添加列视图 工具 帮助斜例 索引列重复列ABC.合悯 微提取xa X00102-1三角函数 叠舍入三A格笠分析统计标科学7信息日时持续文本视Azure 机式.信息准.记数,朗一间,时间”分析觉器学习求和 从数字 从日期和时间 AI见解文件示例中自定调用自定 的列,义列义函数常规查询4 最小值 最大值/alue(插入的合并列 jnull,0,Replac er.Replac eValue,J”,姓名,院系专业 高数*“英语“,V一 bookdata丁中值P L2英语 CJ u体育卷生口 日愣学号姓名_ Sheet 1I 1平均值90 95 752001/3/1192120181-刘备Fl Sheet22标准偏差85 80 802000/10/28193182108-WfeE agri3值计数对非重复值的五檄0 76 852000/12/20185180128孙权4I95 90 802001/5/18197183201-席葛亮5I70 0 902001/6/7193225177关羽660 85 952001/1/15198180601-张 E7h90 90 952001/7/8191180668-赵云885 95 852000/9/30195820165-黄忠990 90 882000/11/16193820550张辽21322数值数据的处理(2)在当前列上进行数值计算 可以对当前的数据列数据进行变换处理;案例:将学生信息表中每个人的体育成绩都加5分。选中体育成绩列,在“转换”选项卡中选择“标准”计算按钮,在下列菜单 中选择“添加”,在“添力口”计算对话框中输入需要增加的值5。越31主页转换添加列L U匚条例y卜 索弓元,示例中自定调用自定 西色即 的列,义列义函数L口处视图 工具 帮助屋I合顺手|翡.也提取格.统计 标 式,力机:信尸准102三角函数 业舍入科学1 F 日 时 持续忖虹1!丽 期,间,时间,三.a文本 视 Azure机 分析 觉 器学习常规I添加J从数字从日期和时间AI见解查询4 新建一列以计算当前所选列的假,加法,eacList.Sum(Aj数,英请,体曾),type number)V中的值的和。如果选择单 列,新列为所选列中的每个窗口上S定值.-bookdata耳1,胡生H侨学号姓名 臼L2加法 0口 SheetlE Sheet2190752001/3/1192120181刘备260285取模802000/10/28193182108-曹操245一 agri30百分比852000/12/20185180128孙权161495802001/5/18197183201诸葛亮265570百分比902001/6/7193225177 关羽16066085952001/1/15198180601-张 124079090952001/7/8191180668-赵云27588595852000/9/30195820165黄忠26599090882000/11/16193820550 张辽268223.2,3日期时间数据处理 L提取日期时间分量 在学生信息表中,可以通过学生的出生日期计算得到学生的出生年份。首先选中出生日期列,然后在“转换列”选项卡中选择“日期”按钮,在下 拉菜单中选择年,即可提取得到学生的出生年份列。文件主页转换3 3 O示例中自定调用自定 的列,义列义函数W条制,索引列,可J重复列添加列视图工具帮助rli合并列 镣提取空H102格 式.崎分析统计 信息,标 准记数从文本从数目三 9 A文本 视 A zure机 分析 觉 器学习A I见解1三角函数,受舍入,;信息3 时 持续 间时间年限m期和时间常规查询4 fx=Table.AddColumn(插入的总和仅日期 分析+5,type number).bookdata12体5 012加法 臼尸年Sheetl195恪260新建一列以包含所选列中每 个日期M间值相应的年.值值月 圜 Sheet2280季度 周 V操245二 agri376h权16149080号葛亮265 5090天 三羽16068595减去天数飞24079095合并日期和时间X云27589585最早星忠265|99088最新辽268233.2,3日期时间数据处理 2.计算日期间隔 在学生信息表中,根据出生日期计算学生的年龄。选中学生的生日列,在“添加列”选项卡中,选择“日期”按钮,然后在下列菜单中选择“年限”,可以得到以“天时分秒毫秒”形式的学生年龄表示。将新建列的列名改为“年龄”,通过“转换”或“添加列”选项卡的“持续时间”按钮的 下拉菜单,选择“总年数”将该列的显示改为以“年”为单位,然后改变该列的数据类型 为“整数”,则可以按照四舍五入的方式得到学生的年龄。示例中自定调用自定的列,义列添力例视图工具用助义函数 常规一1条件列索引列,心重复列统计 信息标任102格 式.记数,从数4/三角函数线舍入,上信息*时持续 间时间 I期和时间与0 A文本 视 Azure机 分析 觉 器学习AI见解从文本年限查询(4)周 245852000Frl agri3852000/12/20185180128-孙权1619020004802001/5/18197183201-谙葛2658520015902001/6/7193225177-关羽天 1609520016952001/1/15198180601 张飞减去天数24010020017952001/7/8191180668赵云合并日期和时间27510020018852000/9/30195820165黄忠最早2659020009882000/11/16193820550米辽最新268932000短转换添加列示例中自定调用自定 的列,义列义函数L 方条件列 fx,索引列,视图 工具:展:格 式.合并列 度提取 会分析,常规 从文本帮助 HQ 102统计 标 科学 信息.准.记数.三角函数,舍入,用信息.从数字查询 20007575.00:00:003 2/20185180128分权创建包含所选列中每个持续1:)20007522.00:00:00197183201-谙葛光时间值的总年数的新列.;20017373.00:00:00总分钟致 55/6/7193225177关羽16020017353.00:00:006 1/15198180601张 E240总秒数-(20017496.00:00:007/7/8191180668赵云275减:1 20017322.00:00:008 9/30195820165黄忠265乘 20007603.00:00:009 1/1619382052 张辽268除1 20007556.00:00:00/吠分析243.3高级类型数据的处理 J SON文件中的每个J SON对象会在PowerBI中被解释为一个记录,而J SON文件 中若干个J SON对象构成的数组会在Power BI中被解释为一个列表。,date:22,ymd:-2018-09-22.,week:11星期六二sunrise:05:57,high:高温 26.0X-,low:低温 15.0U,sunset:,18:10,aqi:55.0,fx-:西北风,fl:4-5- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- POWERBI数据处理和分析 POWERBI数据处理和分析课件 第3章 数据处理基础 POWERBI 数据处理 分析 课件 基础
咨信网温馨提示:
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【曲****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【曲****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【曲****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【曲****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。
关于本文