浅析朴素贝叶斯分类算法在客户关系管理中的简单应用.doc
《浅析朴素贝叶斯分类算法在客户关系管理中的简单应用.doc》由会员分享,可在线阅读,更多相关《浅析朴素贝叶斯分类算法在客户关系管理中的简单应用.doc(7页珍藏版)》请在咨信网上搜索。
精品文档就在这里 -------------各类专业好文档,值得你下载,教育,管理,论文,制度,方案手册,应有尽有-------------- -------------------------------------------------------------------------------------------------------------------------------------------- 浅析朴素贝叶斯分类算法在客户关系管理中的简单应用 摘要:朴素贝叶斯算法主要是运用了概率中的大事件概率作为数学背景,因此在商业领域的数据挖掘中,通过使用贝叶斯算法,可以从顾客的历史消费记录中对未来一段时间内,该类的顾客的消费中做出一个合理的估计,并针对该顾客的消费习惯,合理使用促销手段,从而使得在有效的降低企业成本的同时,获得最大的收益。 关键词:朴素贝叶斯分类算法 0. 前言 在国内商业上对数据挖掘的运用,更倾向于使用数学模型建立不同商品属性之间的相关联系,即通过顾客的历史消费记录,对不同种类的顾客的消费品做出一个大概的估计,并根据不同的消费品为未来一段时间内企业的促销提供支持,其目的是一方面降低企业的促销成本,另一方面是为了是使促销方式能直接的针对潜在客户,即实现“利润最大化”。 从实践的角度上也证明了关联分组挖掘法在商业上的成功应用,但是在现在越来越多的商业问题中,关联分组法的使用不能在最大程度上满足企业的实际需求,因此,在结合相关的概率理论方法上,融入到实际的商业模型中,我们提出朴素贝叶斯分类算法在实际商业过程中的使用。 1. 数据挖掘在市场营销中的作用 数据挖掘在市场营销中的应用,就是把数据挖掘理论和技术同实际的商业问题相结合,并应用到实际的企业问题中去,创建描述和预测模型,并通过一系列的方式和方法不断的优化该商业过程,从而形成有效的营销管理。在结合以往的研究的基础上,可以总结出数据挖掘主要是应用到以下几个方面: (1.1) 寻找潜在的客户。在该方面,数据挖掘能在寻找客户方面起到多方面的作用,在此,我们可以认为具体的作用主要有:识别优等的潜在客户;为满足潜在客户要求制定不同的个性化的沟通渠道;针对不同的潜在客户群选择合适的信息,其中这些信息就包括了沟通信息,促销信息,反馈信息,服务信息等等。 (1.2) 对广告等宣传方式进行数据挖掘,从而制定适合企业自生的宣传方式。从历史和经验角度上,我们知道寻找潜在客户的一种方法是寻找与现有客户类似的人。该过程主要是同历史数据有着很大的关系,因此,在对历史数据进行挖掘前,我们首先就要建立“简档”,即能充分反应这类历史数据的数据文档,从而为能更进一步的数据挖掘提供支持。 (1.3) 通过数据挖掘不断的改善营销活动。在利用各种手段建立数据简档后,剩下的主要工作就是建立有效客户响应模型等数据模型,其目的是优化营销活动收益,为定向营销提供决策支持。 (1.4) 利用现在已有的客户了解潜在的未知的客户。很多成功的数据挖掘模型都得出一个共同的认识,即发现好的潜在的客户的一个最为有效的方法是察看目前最佳的客户来自那里。只有充分的了解已有客户以及和他们的特征的相关记录,才能最为准确的了解潜在客户,并为挖掘潜在客户提供帮助。 从以上几点我们不难看出,数据挖掘在市场营销的作用不仅仅是减少客户的流失,降低企业的运作成本,更为重要的是能通过现有客户,以及他们的行为特征,挖掘出潜在的客户,给企业带来更大的利润。 2.数据挖掘的前期工作 总和前人的实践和研究,我们可以把数据挖掘可以分为三个阶段,第一阶段是数据收集,整理阶段,从各种数据表明,该阶段大概占到整个数据挖掘过程的60%的工作量,数据处理的好坏直接影响到后面两个阶段工作的进程,和挖掘的有效性。第二阶段,就是我们通常所提到的建模阶段。针对不同的行业,不同要求,可以建立客户响应模型,客户流失模型,客户保持模型,风险模型等等,而此阶段主要应用到了回归分析法,因子分析法,关联分析法等等高等数学方法。第三阶段的主要工作是对前期建立的模型,以及实施效果进行评估,反馈和修正。数据挖掘模型的实施一般不会立刻收到成效,更多的是有一个时间缓冲期,因此,对于数据挖掘模型的好坏,要通过未来一段时间,在实施了模型方法后收集到的记录上得以评价,按照质量管理的观点上来看,该过程是一个不断重复的,修正的过程,其目的是从一个粗的,概要营销逐渐向细的,精细营销转变。 3. 朴素贝叶斯分类算法简介 贝叶斯分类算法主要是建立在统计学分类方法的基础上的,该方法在商业上主要用作预测属性成员关系的可能性。贝叶斯分类算法的核心思想就是我们经常说的贝叶斯定理,我们可以用下面的数学式子加以表示: 其中为后验概率,或者是我们经常说的在的条件下,取的后验概率。在实际的商业领域中,我们可以用下面的示例描述为,假设数据元组可以分为sale和income两个属性来描述顾客购买行为,假设用来表示顾客购买电脑,那么,我们用来表示该顾客在sale和income已定的条件下购买电脑的概率。 是我们通常说的先验概率,接着我们上面说的例子,这也就是说任意给定的顾客将购买计算机的概率,而在此时我们并不再去考虑这类顾客的年龄和收入特征。 是指在购买了电脑的条件下,顾客的概率。 在实际的商业数据挖掘过程中,我们通常采用一下步骤对商业数据进行深入的挖掘: (1) 设现有训练集,并且该训练集可用如下属性集加以表示,即。 (2) 设有属性,并且我们的目标是求出一个关于购买的最大概率,由贝叶斯定理,我们此时就可以求出在满足属性的前提下,满足属性的大概率。 在计算的过程中,我们要注意的是,因为我们现在运用的贝叶斯定理是有假设前提的,即训练集的各个属性,是相对独立的,因此我们在前期的数据收集,整理的时候,就要特别注意这个问题,如果一些属性并不是相对独立,而是存在相对影响的,此时我们就不能用朴素贝叶斯分类对预测进行估计了,而是要用到贝叶斯网的相关概念。 (3.1) 朴素贝叶斯分类的示例研究 数据挖掘的运用主要是在实际的过程中,因此,我们在结合朴素贝叶斯分类法的基础上,以下面实际的商业数据为基础,通过建立相关的数学模型,对实际的商业数据进行挖掘,找出隐藏在海量数据中的,对商业决策有价值的信息。 表(3.1)是某商业银行在信用卡销售中所截取的一部分数据 (表3.1) 收入范围 报纸促销 邮寄促销 保险促销 其他信用卡 性别 年龄 30—40K YES NO YES NO MALE 45 30—40K YES YES YES NO FEMALE 47 40—50K NO YES NO NO FEMALE 43 30—40K YES NO YES YES MALE 38 50—60K NO NO YES YES MALE 40 20—30K NO YES YES YES MALE 41 30—40K NO YES NO YES FEMALE 55 40—50K YES YES NO YES MALE 48 30—40K YES YES YES NO FEMALE 28 30—40K YES NO YES NO FEMALE 47 40—50K YES YES NO YES MALE 42 20—30K YES YES NO YES FEMALE 29 50—60K NO YES NO YES MALE 50 40—50K YES NO YES YES FEMALE 48 20—30K YES YES NO YES MALE 32 通过该数据,我们现在的目的是对SEX作为要预测值的输出属性。在进行预测分类之前,我们首先要对该表属性SEX的简单统计,统计结果如下表(3.2)所示。 (表3.2) 报纸促销 邮寄促销 保险促销 其他信用卡 SEX Male Female Male Female Male Female Male Female YES 5 5 5 5 4 4 7 3 NO 3 2 3 2 4 3 1 4 Ratio:yes/total 5/8 5/7 5/8 5/7 4/8 4/7 7/8 3/7 Ratio:no/total 3/8 2/7 3/8 2/7 4/8 3/7 1/8 4/7 我们现在要使用表(2.2)的相关数据,和贝叶斯分类器执行新的分类。我们现在考虑新的实例:{报纸促销=YES,邮寄促销=YES,保险促销=NO,其他信用卡=YES} 我们现在的要求是预测的SEX是男性,还是女性。即现在我们要求出的是在报纸促销,邮寄促销,其他信用卡都是YES,保险促销是NO的情况下,是男性概率大还是女性的概率大。在此,我用E表示{报纸促销=YES,邮寄促销=YES,保险促销=NO,其他信用卡=YES}。 首先我们假设SEX=MALE,那么根据贝叶斯分类,我们有以下式子成立: 由表(2.2),我们首先要求的是在sex=male的条件下,的概率,在之前,我们由朴素贝叶斯的假设可知,E中的属性是相互独立的,即此时 由此,我们可以分别对属性的概率进行计算,计算结果如下: =5/8 =5/8 =4/8 =7/8 及此,我们可以得出在sex=male的前提下,满足E的条件的概率是 = (5/8) (5/8) (4/8) (7/8) = 0.170233 而此时,的先验概率是0.533333。由此,我们可以得出计算结果: =(0.170233)(0.533333)/ =0.090790/ 按照以上的计算思路,我们可以计算出对比式子的概率是: =(0.093710)(0.466666)/ =0.043731/ 对比两组数据,我们不难看出在满足条件E的情况下,sex为male的概率大于sex为female的概率。再次,我们可以预测,在对报纸,邮寄,信用卡的促销有所响应,以及不响应保险促销的前提下,男性的反应程度要大于女性的反应程度。 (3.2)数据挖掘结论讨论 经过上面的数据挖掘,我们得出的结论是不同的促销手段的对性别的影响是有所差异的,在男性没有其他信用卡的时,对报纸促销,邮寄促销的响应度是大于在相同条件下的女性的,因此我们在未来营销策划中,如果是要对使用以上几种促销方法时,更多的是倾向于男性,但是如果单单使用该类方法,即使男性的响应很强烈,但是并没有达到我们要去的目标,在通过其他数据库的分析过程中,我们对男性进行特别的分析,可以得出一些结论,男性在贷款,还款上的响应也是很强烈的,因此才进一步的促销过程中,我们要更多的利用这个挖掘发现,刺激男性在其他相关方面的消费。这样才能达到实际的商业目的。 4. 结束语 商业企业为了构筑持久竞争力,实现企业盈利的最大化,已经逐渐从粗放式的广撒网式营销转变为精细营销,其目的是对不同价值的客户实施差别化服务,在有效的降低成本的同时,扩大从客户中获得的利润。以上实例是针对性的使用了朴素贝叶斯分类的算法对客户数据建模,并挖掘出具有实际意义的分类结果,为企业进一步的制定营销策略提供了一定的参考依据。 参考文献: [1] 蔡琼,唐佳妮. 数据挖掘在银行客户细分中的应用[J]. 软件导刊,2009(3). [2] 蔡春华.浅析数据挖掘在企业CRM中的应用[J].商业现代化[J].2009(1). [2] Olivia Parr Rud. Data Mining Cookbook[M].机械工业出版社,2003. [3] Michael J.A.Berry Gordon S.Linoff. Data Mining Techniques[M].机械工业出版,2006. [4]Jiawei Han Micheline Kamber. Data Mining Concepts and Techiques[M].机械工业出版社,2008. 2010年读书节活动方案 一、 活动目的: 书是人类的朋友,书是人类进步的阶梯!为了拓宽学生的知识面,通过开展“和书交朋友,遨游知识大海洋”系列读书活动,激发学生读书的兴趣,让每一个学生都想读书、爱读书、会读书,从小养成热爱书籍,博览群书的好习惯,并在读书实践活动中陶冶情操,获取真知,树立理想! 二、活动目标: 1、通过活动,建立起以学校班级、个人为主的班级图书角和个人小书库。 2、通过活动,在校园内形成热爱读书的良好风气。 3、通过活动,使学生养成博览群书的好习惯。 4、通过活动,促进学生知识更新、思维活跃、综合实践能力的提高。 三、活动实施的计划 1、 做好读书登记簿 (1) 每个学生结合实际,准备一本读书登记簿,具体格式可让学生根据自己喜好来设计、装饰,使其生动活泼、各具特色,其中要有读书的内容、容量、实现时间、好词佳句集锦、心得体会等栏目,高年级可适当作读书笔记。 (2) 每个班级结合学生的计划和班级实际情况,也制定出相应的班级读书目标和读书成长规划书,其中要有措施、有保障、有效果、有考评,简洁明了,易于操作。 (3)中队会组织一次“读书交流会”展示同学们的读书登记簿并做出相应评价。 2、 举办读书展览: 各班级定期举办“读书博览会”,以“名人名言”、格言、谚语、经典名句、“书海拾贝”、“我最喜欢的___”、“好书推荐”等形式,向同学们介绍看过的新书、好书、及书中的部分内容交流自己在读书活动中的心得体会,在班级中形成良好的读书氛围。 3、 出读书小报: ---------------------------------------------------------精品 文档---------------------------------------------------------------------- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 浅析 朴素 贝叶斯 分类 算法 客户关系 管理 中的 简单 应用
咨信网温馨提示:
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【天****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【天****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【天****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【天****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。
关于本文