pentaho工具使用手册教学文稿.docx
《pentaho工具使用手册教学文稿.docx》由会员分享,可在线阅读,更多相关《pentaho工具使用手册教学文稿.docx(33页珍藏版)》请在咨信网上搜索。
1、 Pentaho工具使用手册作者:马腾,李洪宇版本:1.0目录BI 介绍2Pentaho产品介绍3Pentaho产品线设计4Pentaho BI Platform安装4Pentaho Data Integration-Kettle8Pentaho Report Designer12Saiku23Schema Workbench27附件32BI 介绍1. BI基础介绍BI(BusinessIntelligence)即商务智能,它是一套完整的解决方案,利用数据仓库、数据挖掘技术对客户数据进行系统地储存和管理,并通过各种数据统计分析工具对客户数据进行分析,提供各种分析报告,为企业的各种经营活动提供决
2、策信息。其中的关键点是数据管理,数据分析, 支持决策。根据要解决问题的不同,BI系统的产出一般包括以下三种:2. BI系统的产出2.1 固定格式报表固定格式报表是BI最基本的一种应用,其目的是展示当前业务系统的运行状态。固定格式报表一旦建立,用户就不可以更改报表的结构,只能依据数据库的数据不断刷新报表,以便取得较新的数据。在pentaho产品线中,我们使用pentaho report designer来实现固定格式报表的需求。2.2 OLAP分析OLAP分析是指创建一种动态的报表展示结构,用户可以在一个IT预定义的数据集中自由选择自己感兴趣的特性和指标,运用钻取,行列转换等分析手段实现得到知识
3、,或者验证假设的目的。在pentaho产品线中,我们使用Saiku来实现OLAP分析的需求。2.3 数据挖掘数据挖掘是BI的一种高级应用。数据挖掘是指从海量数据中通过数据挖掘技术得到有用的知识,并且以通俗易懂的方式表达知识,以便支持业务决策。在pentaho产品线中,我们使用weka来实现数据挖掘的需求。Pentaho产品介绍1. 产品介绍Pentaho是世界上最流行的开源商业智能软件,以工作流为核心的、强调面向解决方案而非工具组件的BI套件,整合了多个开源项目,目标是和商业BI相抗衡。它是一个基于java平台的商业智能套件,之所以说是套件是因为它包括一个web server平台和多个工具软件
4、:报表,分析,图表,数据集成,数据挖掘等,可以说包括了商业智能的方方面面。2. Pentaho架构图Pentaho的架构图如下,简要解释如下:3rd party applications指交易系统,也就是数据仓库的原系统。Data & Application Integration主要指定义数据仓库的元数据,在数据仓库结构设计完毕后,通过ETL过程将原系统数据送入数据仓库。Business Intelligence Platform指pentaho提供的BI平台,在这个平台上可以进行平台安全设置,平台管理之类的工作,这个平台也是BI服务的基础。Reporting,Analysis,Dashbo
5、ards,Process Management是基于BI平台上Pentaho可以实现的服务,比如报表,分析,仪表盘,服务自动控制等。Presentation Layer指展示层,在这一层,我们可以把其下层做好的报表等分析结果通过门户网站,Email等各种方式展示给用户。Pentaho产品线设计1. 产品线设计Pentaho作为一个开源的BI套件,商业版与社区版加起来共有几十种产品。考虑到恒信实际业务开展的情况,以及未来可能的需求,确定产品线如下。BI Function ProductETLKettleMetadata ManagementPentaho Metadata Editor (PME
6、)OLAPSaiku + Schema WorkbenchReport toolsFixed report:Pentaho report designerAd-hoc report:Saiku Dashboard:CDE Data MiningWeka BI platformPentaho BI PlatformR languageRBig DataPentaho for Big Data产品线的设计并非一成不变,随着需求的增加,当某些需求无法利用现有的产品线实现时,可以继续添加组件,以便形成更为完善的BI体系。Pentaho BI Platform安装1. 安装步骤将下载下来的biserve
7、r-ce-X.X.X-stable.zip文件解压到D:下,将会产生administration-console和biserver-ce两个文件夹,前者是pentaho控制台,后者是pentaho BI服务器。默认时,Pentaho BI 平台会使用内置的JRE,它位于 D:biserver-cejre 位置。如果用户机器上安装了 JDK,并设置了 JAVA_HOME,则 Pentaho BI 平台会使用用户指定的 JDK。运行D:biserver-ce下的“start-pentaho.bat”批处理脚本能够启动 Pentaho BI 服务器,它运行在 Apache Tomcat容器中,并采纳
8、了 HSQLDB 数据库(http:/hsqldb.org/)。2. 启动/停止BI server现在,打开浏览器,并访问http:/localhost:8080/pentaho,则将看到登录界面,当 joe/password 用户登录后,BI 服务器的主界面将呈现在眼前。如果需要停止 Pentaho BI 服务器,则于 D:biserver-ce 目录下运行“stop-pentaho.bat”批处理脚本即可。它将同时停止 Pentaho BI 服务器和 HSQLDB 数据库。3. 启用/停止Pentaho管理控制台于 D:administration-console 目录运行如下“start
9、-pac.bat”批处理脚本能够启动 Pentaho管理控制台。默认时,它宿主在 Jetty Web 容器中。将浏览器定位到http:/localhost:8099/网址后,并输入默认的admin/password用户,即可登录到Pentaho管理控制台中。Pentaho 管理控制台是整个 BI 平台的重要后端软件,系统管理员通过它能够完成各类操作,比如维护用户及角色信息、注册新的业务库(数据库连接)、控制 BI 服务器中的各种敏感信息、使用调度服务等。如果要停止 Pentaho 管理控制台,则于 D:administration-console 目录下运行“stop-pac.bat”批处理脚
10、本即可。4. HSQLDB迁移到MySQL DB4.1 迁移原因Pentaho BI 服务器的很多重要信息存储在数据库中,其默认使用 HSQLDB 数据库,即借助它存储自身的资料库,比如 Quartz 调度信息、业务资料库连接信息(数据源)等。HSQLDB 是不能够支撑真实的企业应用的,生产环境必须替换它,因此我们需要将HSQLDB迁移至MySQL。4.2 创建MySQL数据库分别执行下面加粗的sql脚本。先后顺序不限。运行方法是多种的,可以通过MySQL Workbench导入工具实现。我们设定导入的MySQL数据库地址为jdbc:mysql:/localhost:3307,用户名root,
11、密码root。biserver-cedatamysql5create_quartz_mysql.sqlbiserver-cedatamysql5create_repository_mysql.sqlbiserver-cedatamysql5create_sample_datasource_mysql.sql其中1. create_repository_mysql.sql 创建hibernate 数据库,用于存储用户授权认证,solution repository以及数据源。2. create_sample_datasource.sql 为sample数据添加pentaho所有基本的实例数据源。
12、3. create_quartz_mysql.sql 为Quartz计划任务器创建资源库。4.3配置Pentaho1 给pentaho添加JDBC文件下载MySQL的JDBC驱动:MySQLmysql-connector-java-x.x.x.jar将其拷贝至biserver-cetomcatlib和administration-consolejdbc下,以便BI service和administration console访问MySQL数据库。2 修改以下文件biserver-cepentaho-solutionssystemapplicationContext-spring-securit
13、y-jdbc.xmlbiserver-cepentaho-solutionssystemapplicationContext-spring-security-hibernate.propertiesbiserver-cepentaho-solutionssystemhibernatehibernate-settings.xmlbiserver-cepentaho-solutionssystemhibernatemysql5.hibernate.cfg.xmlbiserver-cetomcatwebappspentahoMETA-INFcontext.xml以上文件主要是替换SQL驱动,SQL用
14、户名与密码等信息。修改详情如下,红色部分代表文件名,黑体代表更改点。applicationContext-spring-security-jdbc.xml applicationContext-spring-security-hibernate.propertiesjdbc.driver=com.mysql.jdbc.Driverjdbc.url=jdbc:mysql:/localhost:3307/hibernatejdbc.username=rootjdbc.password=roothibernate.dialect=org.hibernate.dialect.MySQL5InnoDBD
15、ialecthibernate-settings.xmlsystem/hibernate/mysql5.hibernate.cfg.xmlmysql5.hibernate.cfg.xmlcom.mysql.jdbc.Driverjdbc:mysql:/localhost:3307/hibernate org.hibernate.dialect.MySQL5InnoDBDialect rootrootcontext.xml 现在可以启动pentaho服务了。可以看到BI环境准备就绪。Pentaho Data Integration-Kettle1. Kettle安装要运行此工具你必须安装 Sun
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- pentaho 工具 使用手册 教学 文稿
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【快乐****生活】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【快乐****生活】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。