pentaho工具使用基础手册.docx
《pentaho工具使用基础手册.docx》由会员分享,可在线阅读,更多相关《pentaho工具使用基础手册.docx(35页珍藏版)》请在咨信网上搜索。
1、 Pentaho工具使用手册作者:马腾,李洪宇版本:1.0目录BI 介绍2Pentaho产品介绍3Pentaho产品线设计4Pentaho BI Platform安装4Pentaho Data Integration-Kettle8Pentaho Report Designer12Saiku23Schema Workbench27附件32BI 介绍1. BI基础介绍BI(BusinessIntelligence)即商务智能,它是一套完整处理方案,利用数据仓库、数据挖掘技术对用户数据进行系统地储存和管理,并经过多种数据统计分析工具对用户数据进行分析,提供多种分析汇报,为企业多种经营活动提供决议信
2、息。其中关键点是数据管理,数据分析, 支持决议。依据要处理问题不一样,BI系统产出通常包含以下三种:2. BI系统产出2.1 固定格式报表固定格式报表是BI最基础一个应用,其目标是展示目前业务系统运行状态。固定格式报表一旦建立,用户就不能够更改报表结构,只能依据数据库数据不停刷新报表,方便取得较新数据。在pentaho产品线中,我们使用pentaho report designer来实现固定格式报表需求。2.2 OLAP分析OLAP分析是指创建一个动态报表展示结构,用户能够在一个IT预定义数据集中自由选择自己感爱好特征和指标,利用钻取,行列转换等分析手段实现得到知识,或验证假设目标。在pent
3、aho产品线中,我们使用Saiku来实现OLAP分析需求。2.3 数据挖掘数据挖掘是BI一个高级应用。数据挖掘是指从海量数据中经过数据挖掘技术得到有用知识,而且以通俗易懂方法表示知识,方便支持业务决议。在pentaho产品线中,我们使用weka来实现数据挖掘需求。Pentaho产品介绍1. 产品介绍Pentaho是世界上最流行开源商业智能软件,以工作流为关键、强调面向处理方案而非工具组件BI套件,整合了多个开源项目,目标是和商业BI相抗衡。它是一个基于java平台商业智能套件,之所以说是套件是因为它包含一个web server平台和多个工具软件:报表,分析,图表,数据集成,数据挖掘等,能够说包
4、含了商业智能方方面面。2. Pentaho架构图Pentaho架构图以下,简明解释以下:3rd party applications指交易系统,也就是数据仓库原系统。Data & Application Integration关键指定义数据仓库元数据,在数据仓库结构设计完成后,经过ETL过程将原系统数据送入数据仓库。Business Intelligence Platform指pentaho提供BI平台,在这个平台上能够进行平台安全设置,平台管理之类工作,这个平台也是BI服务基础。Reporting,Analysis,Dashboards,Process Management是基于BI平台上P
5、entaho能够实现服务,比如报表,分析,仪表盘,服务自动控制等。Presentation Layer指展示层,在这一层,我们能够把其下层做好报表等分析结果经过门户网站,Email等多种方法展示给用户。Pentaho产品线设计1. 产品线设计Pentaho作为一个开源BI套件,商业版和小区版加起来共有几十种产品。考虑到恒信实际业务开展情况,和未来可能需求,确定产品线以下。BI Function ProductETLKettleMetadata ManagementPentaho Metadata Editor (PME)OLAPSaiku + Schema WorkbenchReport to
6、olsFixed report:Pentaho report designerAd-hoc report:Saiku Dashboard:CDE Data MiningWeka BI platformPentaho BI PlatformR languageRBig DataPentaho for Big Data产品线设计并非一成不变,伴随需求增加,当一些需求无法利用现有产品线实现时,能够继续添加组件,方便形成更为完善BI体系。Pentaho BI Platform安装1. 安装步骤将下载下来biserver-ce-X.X.X-stable.zip文件解压到D:下,将会产生administr
7、ation-console和biserver-ce两个文件夹,前者是pentaho控制台,后者是pentaho BI服务器。默认时,Pentaho BI 平台会使用内置JRE,它在 D:biserver-cejre 位置。假如用户机器上安装了 JDK,并设置了 JAVA_HOME,则 Pentaho BI 平台会使用用户指定 JDK。运行D:biserver-ce下“start-pentaho.bat”批处理脚本能够开启 Pentaho BI 服务器,它运行在 Apache Tomcat容器中,并采纳了 HSQLDB 数据库()。2. 开启/停止BI server现在,打开浏览器,并访问htt
8、p:/localhost:8080/pentaho,则将看到登录界面,当 joe/password 用户登录后,BI 服务器主界面将展现在眼前。假如需要停止 Pentaho BI 服务器,则于 D:biserver-ce 目录下运行“stop-pentaho.bat”批处理脚本即可。它将同时停止 Pentaho BI 服务器和 HSQLDB 数据库。3. 启用/停止Pentaho管理控制台于 D:administration-console 目录运行以下“start-pac.bat”批处理脚本能够开启 Pentaho管理控制台。默认时,它宿主在 Jetty Web 容器中。将浏览器定位到htt
9、p:/localhost:8099/网址后,并输入默认admin/password用户,即可登录到Pentaho管理控制台中。Pentaho 管理控制台是整个 BI 平台关键后端软件,系统管理员经过它能够完成各类操作,比如维护用户及角色信息、注册新业务库(数据库连接)、控制 BI 服务器中多种敏感信息、使用调度服务等。假如要停止 Pentaho 管理控制台,则于 D:administration-console 目录下运行“stop-pac.bat”批处理脚本即可。4. HSQLDB迁移到MySQL DB4.1 迁移原因Pentaho BI 服务器很多关键信息存放在数据库中,其默认使用 HSQ
10、LDB 数据库,即借助它存放本身资料库,比如 Quartz 调度信息、业务资料库连接信息(数据源)等。HSQLDB 是不能够支撑真实企业应用,生产环境必需替换它,所以我们需要将HSQLDB迁移至MySQL。4.2 创建MySQL数据库分别实施下面加粗sql脚本。前后次序不限。运行方法是多个,能够经过MySQL Workbench导入工具实现。我们设定导入MySQL数据库地址为jdbc:mysql:/localhost:3307,用户名root,密码root。biserver-cedatamysql5create_quartz_mysql.sqlbiserver-cedatamysql5crea
11、te_repository_mysql.sqlbiserver-cedatamysql5create_sample_datasource_mysql.sql其中1. create_repository_mysql.sql 创建hibernate 数据库,用于存放用户授权认证,solution repository和数据源。2. create_sample_datasource.sql 为sample数据添加pentaho全部基础实例数据源。3. create_quartz_mysql.sql 为Quartz计划任务器创建资源库。4.3配置Pentaho1 给pentaho添加JDBC文件下载M
12、ySQLJDBC驱动:MySQLmysql-connector-java-x.x.x.jar将其拷贝至biserver-cetomcatlib和administration-consolejdbc下,方便BI service和administration console访问MySQL数据库。2 修改以下文件biserver-cepentaho-solutionssystemapplicationContext-spring-security-jdbc.xmlbiserver-cepentaho-solutionssystemapplicationContext-spring-security-
13、hibernate.propertiesbiserver-cepentaho-solutionssystemhibernatehibernate-settings.xmlbiserver-cepentaho-solutionssystemhibernatemysql5.hibernate.cfg.xmlbiserver-cetomcatwebappspentahoMETA-INFcontext.xml以上文件关键是替换SQL驱动,SQL用户名和密码等信息。修改详情以下,红色部分代表文件名,黑体代表更改点。applicationContext-spring-security-jdbc.xml a
14、pplicationContext-spring-security-hibernate.propertiesjdbc.driver=com.mysql.jdbc.Driverjdbc.url=jdbc:mysql:/localhost:3307/hibernatejdbc.username=rootjdbc.password=roothibernate.dialect=org.hibernate.dialect.MySQL5InnoDBDialecthibernate-settings.xmlsystem/hibernate/mysql5.hibernate.cfg.xmlmysql5.hib
15、ernate.cfg.xmlcom.mysql.jdbc.Driverjdbc:mysql:/localhost:3307/hibernate org.hibernate.dialect.MySQL5InnoDBDialect rootrootcontext.xml 现在能够开启pentaho服务了。能够看到BI环境准备就绪。Pentaho Data Integration-Kettle1. Kettle安装要运行此工具你必需安装 Sun 企业 JAVA 运行环境 1.4 或更高版本。Kettle 下载可经过。我们将下载 pdi-ce-4.4.0-stable.zip 解压到想要放置路径,并实
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- pentaho 工具 使用 基础 手册
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【a199****6536】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【a199****6536】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。