示例2 数据挖掘技术在电子商务中的应用.doc
《示例2 数据挖掘技术在电子商务中的应用.doc》由会员分享,可在线阅读,更多相关《示例2 数据挖掘技术在电子商务中的应用.doc(18页珍藏版)》请在咨信网上搜索。
数据挖掘技术在电子商务中的应用 ——以亚马逊为例的数据挖掘应用分析 作者:吴玩秋 陈欣 刘晓驰 张颖 袁燕芳 班级:093电子商务 指 导 老 师:蒋盛益 报告提交时间:2011-06-12 目录 摘要 …………………………………………………………………………………………………………………………2 第一章 绪论 1.1调研背景………………………………………………………………………………2 1.2数据挖掘应用对电子商务领域的意义……………………………………………………2 1.3数据挖掘技术的应用现状……………………………………………………………3 1.4数据挖掘主要方法……………………………………………………………………4 1.5数据挖掘过程…………………………………………………………………………4 1.51数据挖掘过程图……………………………………………………………………5 1.52数据挖掘过程简介……………………………………………………………………5 第二章 以亚马逊为例的数据挖掘应用分析 2.1数据挖掘在电子商务中的应用分析——客户获得…………………………………6 2.11 客户获得的定义…………………………………………………………………6 2.12数据挖掘技术在客户获得中的应用意义………………………………………6 2.13客户获得的步骤…………………………………………………………………7 2.2数据挖掘在电子商务中的应用分析——客户细分…………………………………8 2.21客户细分的定义…………………………………………………………………8 2.22客户细分的意义…………………………………………………………………8 2.23数据挖掘算法进行客户细分的流程……………………………………………9 2.24亚马逊网站的客户分析……………………………………………………9 2.3数据挖掘在电子商务中的应用分析——客户保留…………………………………11 2.31客户保留的意义……………………………………………………………………11 2.32客户流失原因的分析………………………………………………………………12 2.33数据挖掘在亚马逊电子商务平台的挖掘目标……………………………………13 2.34亚马逊在建立客户流失模型的过程………………………………………………13 2.4数据挖掘在电子商务中的应用分析——个性化服务…………………………………14 2.41个性化服务的定义…………………………………………………………………14 2.42个性化服务的特点…………………………………………………………………14 2.43电子商务个性化服务的意义………………………………………………………15 2.44 电子商务个性化服务的类型………………………………………………………15 2.45数据挖掘技术亚马逊个性化服务中的应用………………………………………16 2.5数据挖掘在电子商务中的应用分析——资源优化……………………………………18 2.51资源优化的意义……………………………………………………………………18 2.52数据挖掘在亚马逊资源优化方面的应用…………………………………………18 第三章 局限性分析 3.1数据挖掘在电子商务中应用的局限性………………………………………………21 总结和体会……………………………………………………………………………………21 摘要 随着网络的迅速发展,电子商务的应用不断深入。在电子商务应用系统中,相关的用户数据日益增多,而数据挖掘技术具有从大量复杂数据中发现特定规律的能力。商业的电子化趋势不仅为客户提供了便利的交易方式和广泛的选择,同时也为商家提供了更加深入了解客户需求信息和购物行为特征的可能性。 在前人研究的基础上,我们小组以亚马逊网站为研究对象,对数据挖掘技术在亚马逊网站这个电子商务平台的应用进行分析。本文通过对亚马逊网站的客户获得,客户细分,客户保留,个性化服务以及资源优化这五个方面进行分析,得出数据挖掘在电子商务中的重要性。 第一章 绪论 1.1调研背景 随着网络技术和数据库技术的成熟,全球传统商务正经历一次重大变革,向电子商务全速挺近。这种商业电子化的趋势不仅为客户提供了便利的交易方式和广泛的选择,同时也为商家提供了更加深入地了解客户需要信息和购物行为特征的可能性。数据挖掘技术作为电子商务的重要应用技术之一,将为正确的商业决策提供强有力的支持和可靠的保证,是电子商务不可缺少的重要工具。电子商务的发展促使公司内部收集了大量的数据,并且迫切需要将这些数据转换成有用的信息和知识,为公司创造更多潜在的利润,数据挖掘概念就是从这样的商业角度开发出来的。数据挖掘涉及的科学领域和方法很多,其核心技术经历了数十年的发展其中包括统计,近邻,聚类,决策树,神经网络和规则等。今天,这些成熟的技术在电子商务中已进入了使用阶段,并取得了良好的效果。 1.2数据挖掘应用对电子商务领域的意义 ⑴数据挖掘有助于发现电子商务业务发展的趋势,帮助电子商务企业做出正确的决策,使企业处于更有利的竞争位置。商业电子化的趋势不仅为客户提供了便利的交易方式和广泛的选择,同时也为商家提供了更加深入地了解客户需求信息和购物行为特征的可能性。数据挖掘技术作为电子商务的重要应用技术之一,将为正确的商业决策提供强有力的支持和可靠的保证,是电子商务不可缺少的重要工具。 ⑵数据挖掘有助于客户关系管理,特别是对电子商务客户关系管理起着决定性的作用。数据挖掘主要是找寻隐藏在数据中的信息,例如发现趋势、特征及相关性的过程,也就是从数据中发掘出信息或知识。以此对客户需求进行深入分析以满足企业对个体细分市场的客户关系管理需求。从发现客户到客户分类再到客户管理,数据挖掘通过各种针对性技术为企业客户关系管理提供了强有力的保证。将数据挖掘技术应用于客户关系管理,能够帮助企业深入理解客户,得到更加准确的客户模型,从而改进营销决策和客户服务。 ⑶数据挖掘可以促进电子商务平台的发展,加强企业电子商务平台应用的普及度。采用数据挖掘技术将电子商务中丰富的数据源信息进行有效组织利用对电子商务的具有巨大的应用价值。同时数据挖掘对于电子商务平台信息的挖掘分析可以帮助检验电子商务平台的性能,促进电子商务平台的智能化,帮助企业打造更具可操作性及吸引力的消费平台,为消费者提供更便利的消费环境。 ⑷数据挖掘有利于企业资源优化,合理分配资源以实现资源价值最大化。数据挖掘进行有效的统计分析挖掘,可以指导营销的组织和分配,让企业在市场竞争中处于有利位置抢占先机。通过数据挖掘可以发现消费者的消费特性,从而帮助制定个性化服务,极大地吸引顾客,既避免资源浪费,又为企业带来巨大的价值。 1.3数据挖掘技术在电子商务的应用现状 由于数据挖掘能带来显著的经济效益,它在电子商务中(特别是金融业、零售业和电信业)应用也越来越广泛。数据挖掘技术在电子商务中重要应用于客户获得,客户细分,客户保留,个性化服务以及资源优化这几个方面。像亚马逊等零售业是数据挖掘的主要应用领域,这是因为零售业积累了大量的销售数据,如顾客购买史记录、货物进出、消费与服务记录以及流行的电子商务等等都为数据挖掘提供了丰富的数据资源。零售数据挖掘有助于划分顾客群体,使用分类技术和聚类技术,可以更精确地挑选出潜在的顾客;识别顾客购买行为,发现顾客购买模式和趋势,进行关联分析,以便更好地进行货架摆设等等。 1.4数据挖掘主要方法 目前, 在很多领域, 数据挖掘都是一个很时髦的词, 数据挖掘所能解决的典型商业问题有很多, 下面就分别介绍数据挖掘的六种常用数据挖掘得方法。 ⑴数据统计方法 使用这些方法一般首先建立一个数据模型或统计模型,然后根据这种模型提取有关的知识。例如,可由训练数据建立一个 Bayesian 网,然后,根据该网的一些参数及联系权重提取出相关的知识。 ⑵关联规则方法 关联规则是描述数据之间存在关系的规则, 形式为“A1 ∧A2 ∧⋯An →B1 ∧B2 ∧⋯Bn”。一般分为两个步骤: 第一步, 求出大数据项集。第二步, 用大数据项集产生关联规则数据库一组。运用关联规则的数据项往往存在某种潜在关联关系的规则。一找出所有类似的关联规则,对于企业确定生产销售、产品分类设计、市场分析等多方面是有价值的。 ⑶人工神经网络方法 人工神经网络是由大量的简单神经元,通过极其丰富和完善的连接而构成的自适应非线性动态系统,并具有分布存储、联想记忆、大规模并行处理、自组织、自学习、自适应等功能。人工神经网络是一种有效地预测模型,在聚类分析、奇异点分析、特征提取中可以得到。通过模拟人的神经元功能, 经过输入层、隐藏层、输出层等, 对数据进行调整、计算, 最后得到结果, 用于分类和回归。 ⑷决策树方法 决策树算法是目前应用最广泛的归纳推理算法之一,是一种逼近离散值函数的方法。它是以实例为基础的归纳学习算法, 通常用来形成分类器和预测模型,着眼于从一组无次序、无规则的事例中推理出决策树表示形成的分类规则。它采用自顶向下的递归方式,在决策树的内部结点进行属性值的比较并根据不同的属性值判断从该结点向下的分支,最后在决策树的叶结点得到结论。因此从根到叶结点的一条路径就对应着一条合取规则,而整棵决策树就对应着一组析取表达式规则。决策树可能是现在最流行的有指导数据挖掘结构。 ⑸聚类方法 聚类分析是对群体及成员进行分类的递归过程。一个簇是一组数据对象的集合,在同一簇的对象彼此类似,而不同簇中的对象彼此相异。将一组物理或抽象对象分组成为由类似对象组成的多个簇的过程被称为聚类。聚类是将数据对象分组成为多个类或簇,在同一个簇中的对象具有较高的相似度,而不同簇中的对象差别较大。 ⑹可视化技术 数据与结果被转化和表达成可视化形式,如图形、图像等,使用户对数据的剖析更清楚。 1.5数据挖掘过程 1.51数据挖掘过程图 图1:数据挖掘的基本过程和主要步骤 1.52数据挖掘过程简介 过程中各步骤的大体内容如下: ①确定业务对象 清晰地定义出业务问题,认清数据挖掘的目的是数据挖掘的重要一步.挖掘的最后结构是不可预测的,但要探索的问题应是有预见的,为了数据挖掘而数据挖掘则带有盲目性,是不会成功的. ②数据准备 a数据的选择:搜索所有与业务对象有关的内部和外部数据信息,并从中选择出适用于数据挖掘应用的数据. b数据的预处理:研究数据的质量,为进一步的分析做准备.并确定将要进行的挖掘操作的类型. c数据的转换:将数据转换成一个分析模型.这个分析模型是针对挖掘算法建立的.建立一个真正适合挖掘算法的分析模型是数据挖掘成功的关键. d数据挖掘:对所得到的经过转换的数据进行挖掘.除了完善从选择合适的挖掘算法外,其余一切工作都能自动地完成. e结果分析:解释并评估结果.其使用的分析方法一般应作数据挖掘操作而定,通常会用到可视化技术. f知识的同化:将分析所得到的知识集成到业务信息系统的组织结构中去 第二章 以亚马逊为例的数据挖掘应用分析 概述: 数据挖掘技术作为电子商务的重要应用技术之一,将为正确的商业决策提供强有力的支持和可靠的保证,是电子商务不可缺少的重要工具。在电子商务日益普及的今天,数据挖掘在电子商务领域的应用成为技术领域关注的热点。本章以世界著名的电子商务平台----亚马逊为例,从客户获得、客户细分、客户保持、个性化服务、资源优化五个主要方面分析数据挖掘技术在电子商务上的具体应用。 2.1数据挖掘在电子商务中的应用分析——客户获得 2.11 客户获得的定义 客户获得是指企业在吸引潜在客户转变为实际购买者这一过程中所运用的策略和方法。客户获得的最佳值取决于企业保留客户的能力、客户重复购买的频次以及与保留客户相比获得客户的相对机遇。 2.12数据挖掘技术在客户获得中的应用意义 在没有利用数据挖掘技术时,客户获取的传统方法就是选出一些感兴趣的人口调查其属性,获取这些人口的特征即可。但随着数据量的增大,传统的方法具有不可实现性。利用数据挖掘在扩展客户市场活动时,利用数据挖掘技术挖掘出潜在的客户名单,在客户名单上列出可能对某些产品感兴趣的客户信息,便可更方便的获取更多的客户。分类通过分析已知分类信息的历史数据,总结出一个预测模型,预测哪些人可能会对邮寄广告、产品目录等有反应,可以针对这一类客户的特点展开商务活动,提供个性化的信息服务。具体的操作过程,一般是先从数据仓库中收集客户的相关信息,用数据挖掘的一些算法对其进行处理和转换,并对客户的未来行为进行预测分析,这样,针对不同类型的客户确定一个或多个分析发现流程,从而自动锁定重点客户。 [1] 李红,梁大鹏. 数据挖掘技术在商场CRM中的应用.《商场现代化》.2011 [2] 吴跃.数据挖掘在电信客户流失中的应用研究.中国优秀硕士学位论文全文数据库. 2006. 97-99 [3] 埃弗雷姆•特伯恩.电子商务管理新视角第2版.北京.电子工业出版社.2010 用于分类分析的技术有很多,典型方法有统计方法的贝叶斯分类、机器学习的判定树归纳分类、神经网络的后向传播分类等。 2.13客户获得的步骤 1.建立关系阶段。是卖方确立客户,买卖双方建立互信的阶段,买方对你的产品和服务并没有真正的使用经验。这个阶段是客户营销中最为关键的,也是需要消耗最多资源的。 2.稳定关系阶段。与客户关系进入稳定期以后,工作重点和关键就发生了转移,这个时候工作重点应该放在防止意外情况发生和积极进行危机管理。进入稳定阶段以后,沟通在客户管理中起着非常重要的作用。 3.加强关系阶段。随着买卖双方信任和了解的加固,卖方应该对自己满足客户的能力进一步地加强和要求,应该更加深入分析客户的需求潜力。这也是增加销售内容和加固关系的最佳时期。在加强阶段要和客户建立一个互利互惠的关系。 在客户获得上,亚马逊公司过各种具体措施收集客户信息并采用数据挖掘技术预测客户,并逐步建立与客户间的关系,最终获得稳定客户。 首先,在网站首页设立客户注册栏,,获得客户本人基本信息,为客户设立专门档案管理,以便于记录客户行为,比如设置search栏等方法,获得客户点击浏览过哪些商品,购买过哪些商品,满意度如何等信息。这样利用数据挖掘整理出的客户资料可以为未知客户的行为提供对照,以便于进行下一步对未知客户的发掘。 其次,亚马逊的顾客在亚马逊网站WEB 上的行为都会产生大量数据信息,不仅包括本次交易信息而且还有利用搜索引擎以及在站点内进行浏览的相关数据,这些数据中包含了对市场分析及预测非常有益的潜在信息。亚马逊根据客户消费行为及商品销售情况或通过web、cookie等技术获得的数据进行数据挖掘,对已知客户的消费行为制定一个数据库和一组具有不同特征的类别(标记),这样就将该已知客户数据库中的每一个记录都赋予一个类别的标记,即设定训练集。这是与客户之间建立关系的阶段。 然后,通过分析示例数据库中的数据,为每个类别做出准确的描述或建立分析模型或挖掘出分类规则,通过分析已知分类信息的历史数据,总结出一个预测模型,然后用这个分类规则对其它数据库中的记录进行分类。 最后,通过数据挖掘分类方法可以将未知客户分类为不同类别,这样就可以预测哪些客户是潜在客户,有针对性的进行商品广告、促销等个性化服务,这样便可最大程度挖掘潜在客户,获得更多客户 。通过分析锁定客户,稳定与客户的关系。 亚马逊在自己的网站上使用的都是“一点通”的程序设计。任何人只要在亚马逊网上书店购物过一次,系统就会自动地记下购物者得的相关资料,当下再购买时,只要在你选中的物品上轻轻一点,一键就可以完成余下的所有操作。系统将自动为你刷卡付费,为你填写好邮寄方式和地址等收件资料。更有趣的是,如果在礼品中心购物,如果你去年已经在亚马逊购买了情人节礼物,那么今年你再去时,甚至连收礼人的地址都不需你填,亚马逊的强大的的服务部队会自动、准确无误地将你的礼品送到去年的那个人手上。亚马逊通过数据挖掘为稳定的客户提供更便利的服务,加强与客户间的关系,这是客户获得的有力保障。 2.2数据挖掘在电子商务中的应用分析——客户细分 2.21客户细分的定义 客户细分是20世纪50年代中期由美国学者温德尔史密斯提出的,其理论依据在于顾客需求的异质性和企业需要在有限资源的基础上进行有效地市场竞争.是指企业在明确的战略业务模式和特定的市场中,根据客户的属性,行为,需求,偏好以及价值等因素对客户进行分类,并提供有针对性的产品,服务和销售模式. 2.22客户细分的意义 顾客天生就存在差异,大量营销策略在忠诚的世界里根本就不适用,因为并不是每一个顾客都适于成为某品牌的品牌忠诚者。如果企业要最大化地实现可持续发展和长期利润,就要明智地只关注正确的顾客群体,因为企业要获得每一位顾客,先前都要付出一定的投入,这种投入只有在你能赢得顾客的忠诚后才能得到补偿。因此,要通过价值营销以获得品牌忠诚重要的一步就是对客户进行细分,找寻到哪些顾客是能为企业带来赢利的,哪些顾客不能,并锁定那些高价值顾客。只有这样企业才能保证他在培育顾客忠诚的过程中所投入的资源得到回报,企业的长期利润和持续发展才能得到保证。传统的分析方法对存在可伸缩性,高维性,异种数据和复杂数据的问题,而数据挖掘技术就是为了解决上述问题而诞生的。 2.23数据挖掘算法进行客户细分的流程 ①客户数据 ↑↑ ↑↑ 选择关注的客户群 ②细分参考标准 ⑤确定每群客户特征 图2:数据挖掘算法进行客户细分流程图 2.24亚马逊网站的客户分析 亚马逊网站通过长期的观察,获得了顾客的大量信息:顾客作为某品牌的顾客的时间周期,每个时间周期内顾客购买某种品牌的频数,顾客购买该品牌产品的平均贡献,顾客购买该品牌的概率。利用贝叶斯方法,聚类等数据挖掘技术,通过顾客的年龄,职业,性别,收入(通过顾客勉强维持生活,正常生活,小康水平,我们划分为1000-2000,,2000-5000,以及5000以上),我们推测亚马逊网站利用贝叶斯方法,聚类等数据挖掘技术,将目标客户细分成如下表: 表1:亚马逊的客户细分表 年龄 职业 性别 收入水平 购买行为 偏好的喜好 22岁以下 学生 男 低(1000-2000) 便宜,实惠, 服装、虚拟产品、电子产品 中(2000-5000) 追求品牌 高(5000以上) 个性化, 款式 女 低(1000-2000) 敏感,选择少,时尚 服装、化妆品、食品 中(2000-5000) 品牌、款式、新潮、时尚 高(5000以上) 世界品牌、炫耀、高贵、华丽 25—39岁 商业人士 男 低(1000-2000) 便宜 数码、电子产品 中(2000-5000) 款式,品牌 高(5000以上) 独特性,品牌,质量 女 低(1000-2000) 便宜,潮流 服装、化妆品、家居、生活用品 中(2000-5000) 时尚,款式 高(5000以上) 品牌,质量,时尚 企业人士 男 低(1000-2000) 实惠,便宜 数码、电子产品 中(2000-5000) 款式,品牌 高(5000以上) 个性化,品牌,质量 女 低(1000-2000) 便宜,实惠 服装、化妆品、保养品、家居、生活用品 中(2000-5000) 时尚,款式 高(5000以上) 品牌,质量 职业人士 男 低(1000-2000) 实惠,便宜 数码、电子产品 中(2000-5000) 款式,品牌 高(5000以上) 独特性,品牌,质量 女 低(1000-2000) 便宜,实惠 服装、化妆品、保养品、家居、生活用品 中(2000-5000) 时尚,款式 高(5000以上) 品牌,质量 40---55 商业人士 男 低(1000-2000) 实惠,便宜 家居、生活用品 中(2000-5000) 款式,品牌 高(5000以上) 独特性,品牌,质量 女 低(1000-2000) 便宜,实惠 家居、生活用品 中(2000-5000) 时尚,款式 高(5000以上) 品牌,质量 企业人士 男 低(1000-2000) 实惠,便宜 家居、生活用品、健身器材 中(2000-5000) 款式,品牌 高(5000以上) 独特性,品牌,质量 女 低(1000-2000) 便宜,实惠 家居、生活用品、化妆品、保养品 中(2000-5000) 时尚,款式 高(5000以上) 品牌,质量 职业人士 男 低(1000-2000) 实惠,便宜 收藏品、健身器材 中(2000-5000) 款式,质量 高(5000以上) 质量 女 低(1000-2000) 便宜,实惠 家居、生活用品、化妆品、保养品 中(2000-5000) 款式,耐用 高(5000以上) 品牌,质量 56岁以上 退休人士 男 低(1000-2000) 实惠 家居、生活用品 中(2000-5000) 款式 高(5000以上) 质量 女 低(1000-2000) 实惠 家居、生活用品、保养品 中(2000-5000) 质量 高(5000以上) 品牌,质量 通过客户细分,亚马逊网站可以有针对性地向不同类型的顾客提供不同类型的符合客户需求的产品和服务。另外,亚马逊网站也通过客户细分,了解到哪些客户是最有价值的客户,哪些是企业的忠诚客户,哪些是企业的潜在客户,哪些客户的成长性最好,哪些客户最容易流失,从而有针对性的提出销售策略。这也是亚马逊网站成为龙头老大的原因之一。 2.3数据挖掘在电子商务中的应用分析——客户保留 2.31客户保留的意义 随着互联网的发展,电子商务市场的竞争日趋激烈,客户选择的产品、网站的服务及网站的余地越来越大,因此电子商务平台之间对客户的争夺也越来越激烈。以往传统的网络、技术等优势难以在电子商务平台之间拉开差距,无法形成明显的差异话的竞争优势。因此,为了在新的电子商务市场形势下能够培育和创造出新的差异化竞争,电子商务平台以客户为中心,深入地了解客户,引导客户,留住客户。根据某调查数据显示,“用户保持率”增加5%,就有望为运营商带来85%的利润增长。由此可见用户流失对业绩的影响之大,防止用户流失是企业是否盈利的必要条件。因此,为了避免由客户流失造成的损失,我们必须找出那些有流失危险和最有价值的客户,并相应开展保留和获取客户的活动。数据挖掘技术凭借其在大量看似杂乱无章的数据中发现潜在规律的强大优势,正在为更多的企业用来进行分析用户消费行为特征、信用度等,从而降低企业的经营风险,为企业开展针对性营销提供强有力的技术支撑。 2.32客户流失原因的分析 在亚马逊的客户分析系统中,明确了客户流失的定义,并将客户流失分为:被动流失和主动流失;被动流失是因为客户恶意拍下商品,长期不付款;主动流失有不同的原因:1、主观原因限制所引起的异动,如住处物流交通不便2、另一类是客户主动放弃,如因为竞争对手的优惠政策,对目前的服务不满意,消费者偏好改变实体店购物等。 在这些群体中,主动流失的客户是亚马逊在做客户流失分析中重点分析的对象,亚马逊根据客户的信用度等级和此客户所带来的利润分成不同的小群体,如图所示: 高 用 户 信 用 度 ③ ① 低 ④ ② 高 低 图3: 客户重要性等级 在这些小群体中,用户价值和信用度高的可能流失的用户(如图3.1中的①类客户)是亚马逊最关心的对象,如果能过成功地预测这类客户,并能够成功地挽留这类客户,将给亚马逊带来可观的利润,对于那些信用度低而价值高的客户(如图3.1中的②类客户)是需要次关心的客户,他们可能会盗打,对这类客户加以挽留的同时要采取一定的策略防止他们进行欺诈的可能。其次需要关心的群体是信用度高而价值低的客户(如图3.1中的③类客户),可以提供他们感兴趣的业务或实行一定的优惠政策来加以挽留。第四类客户在通常情况下是可以不予考虑。 2.33数据挖掘在亚马逊电子商务平台的挖掘目标 对历史数据使用决策树、logistic回归和神经网络技术,分别建立模型,以价值和预测概率为过滤条件对一部分客户进行分群分析。利用客户流失模型,对高价值高流失概率的客户进行客户特征分群,并根据不同群的特征图给出不同的特征描述,为市场人员对这些客户进行精细化营销提供支持。 2.34亚马逊在建立客户流失模型的过程 ①数据获得 亚马逊拥有强大的数据库系统(云环境中的关系数据库 ②数据的选择与理解: 客户的历史行为中隐含大量与流失相关的行为模式,数据必须围绕市场分析得到的与相关的信息来组建。从数据库中抽取基本客户群、客户基本资料、客户的缴费资料、客户投诉资料、客户帐单、客户消费习惯等信息形成信息表,然后根据用户号和帐务年月进行连接,形成了亚马逊进行分析的原始数据。同时在原始数据的基础上,根据业务专家的意见,进一步衍生有可能与流失相关的属性 ③数据的预处理与准备: 亚马逊对收集到的原始数据进行缺失值的处理,进行抽样分析,进行异常数据处理,得出候选变量,最后对候选变量进行选择,最终形成用于建模使用的候选变量集。 ④客户流失模型的建立: 基于上面的数据准备,得到的数据集合,亚马逊对所得的数据集合进一步分析,通过不断的调试,根据三种方法使用不同变量集合建立起来多个流失模型 用于流失模型建立的三种方法: ⑴ logistic回归模型 ⑵ 神经网络模型 ⑶ 5.0 决策树模型 ⑤模型的评估: 根据所建立的多个模型使用两种方法进行模型评估,并找出相对优的模型 2.4数据挖掘在电子商务中的应用分析——个性化服务 2.41个性化服务的定义 个性化服务是基于信息用户的信息使用行为、习惯、偏好和特点,来向用户提供满足其各种个性化需求的一种服务。其核心内容是在尊重用户个体的基础上,研究用户的行为和习惯,为用户选择更重要、更合适的信息资源,提供有特色的服务。 2.42个性化服务的特点 个性化服务具有几个非常明确的特点: a针对性:个性化服务的根本就是以用户为中心,所有的服务必须以方便用户、满足用户需求为前提。通过对用户的行为、兴趣、爱好和习惯的研究,自动组织信息内容和调整服务模式,以便能更好地为用户提供更具针对性的服务。 b可定制性:在个性化服务中,用户能够充分表达个性化需求,动态地定制自己想要的用户界面、信息资源、信息服务种类和服务方式,创造适应自己的信息活动环境,从而获得“量身定制”的服务。 c主动性:个性化服务能够主动感知不同用户的个性化需求并将用户所需要的信息及时推送给用户。这种“信息找人”的主动服务模式与传统“人找信息”的被动服务模式截然不同。 d智能性:个性化服务中采用了推理反馈、机器学习和智能代理等人工智能技术,这些技术通过跟踪和学习用户的习惯、爱好,建立用户模型和信息模型,不断挖掘用户潜在的兴趣特征,实现信息的智能推荐和智能过滤,从而显著提高服务质量。 2.43电子商务个性化服务的意义 在电子商务中引入个性化技术,其商务模式由以供应商为中心转向以客户为中心,利用个性化的服务工具来了解和学习客户的需求与喜好,根据客户提出的明确要求提供服务,或通过对客户个性、使用习惯的分析而主动地组织信息资源,创建个性化的服务环境,向客户提供其可能需要的服务。这样不但使客户在面对电子商务网站提供的上万甚至上百万种产品时能大大节省在商品搜索上花费的时间和精力,而且提高了客户对电子商务网站的忠诚度,增加了用户的访问次数,实现了将更多的电子商务网站的浏览者转变为商品的购买者,提高了电子商务网站的交叉销售能力,为电子商务企业提供更多的盈利机会。 2.44 电子商务个性化服务的类型 个性化服务是通过获取用户的个性化信息,从而理解用户的需求,为用户提供更为准确的服务,提高用户的满意度。同时通过与用户直接的或间接的沟通,改善与用户的关系,提高用户的忠诚度。电子商务个性化服务主要包括个性化内容定制服务、个性化信息检索服务和个性化信息推荐服务3类。 (1)个性化内容定制服务 在个性化内容定制服务中,用户可以根据自己的兴趣和需求定制信息。定制的内容包括信息资源、界面、服务等等。电子商务网站在提供个性化内容定制时,如亚马逊Amazon,用户每次登录网站时,只要键入自己的账户名与密码,服务器就可以将查询结果主动传递给信息用户,并利用动态网页自动生成用户定制的动态页面。 (2)个性化信息检索服务 电子商务网站中最常用的是按照关键词进行检索,输出的检索结果较多,用户一般要花费大量的时间才能找到自己所需要的信息。个性化信息检索根据用户提出的明确要求进行信息检索,或通过对用户个性、使用习惯的分析而主动地分析出用户的检索目的,使检索结果更符合用户的需要。 (3)个性化信息推荐服务 通过网络信息的挖掘,了解用户的需求和兴趣,为用户提供个性化的实时信息推荐服务,也是电子商务个性化服务的一个发展方向。个性化推荐服务不仅能根据用户的特征提供具有针对性的信息,还能根据用户特征、兴趣主动地向用户推荐其需要的信息。 2.45亚马逊的个性化服务 亚马逊这家超级书店的服务有以下特色:方便的浏览和搜索、有用的产品信息评论、建议和个性化内容、广泛的选择余地、较低的价格、单击下单技术、电子钱包、安全支付系统,以及高效的订单执行。亚马逊还提供其他服务以使得在线购物更加有趣。它的“礼品创意”部分提供随季节而变的礼品创意和服务。在“社区”部分,它提供了一个场所共顾客交流产品信息和经验。在“电子贺卡”部分,顾客可以向朋友和家人寄发免费的电子动画贺卡。还有注册用户的在线管理订单服务可以允许用户:查询他们的订单处理状态,撤销为装运订单的送货选项和地址,修改为装运订单的支付方式,订阅商品更新个人提示服务。亚马逊的这些个性化服务带来了令人满意的购物体验,并促使顾客再次访问该网站。 2.46数据挖掘技术亚马逊个性化服务中的应用 1.Web挖掘技术在电子商务个性化服务中的应用过程如下: (1)数据收集 Web日志文件中的数据主要通过Web服务器端自动收集并保存用户的注册信息、访问内容、访问行为等信息,以及客户端、代理服务器端的信息。启动Web服务器的日志记录功能后,每当浏览者通过浏览器请求一个网页时,这个请求被记录在访问日志中。代理服务器就把所记录的信息保存在文本文件中,通常以“.txt”或“.log”作为文件的扩展名。Web日志文件是由一条条记录组成,一条记录就记录了购书者对Web页面的一次访问。每个客户的访问行为、访问频率等信息,都会在Web服务器中被自动收集并保存,这些原始数据是Web日志挖掘的基础数据来源。 Web服务器还可以存储其他的Web使用信息,比如Cookie。Cookie是由服务器产生的,用于记录购书者的状态或者访问路径。由于涉及到购书者的隐私问题,使用Cookie需要客户的配合。 亚马逊网站会利用Cookie文件来识别用户身份,当用户再次访问亚马逊网站时,就会显示类似“欢迎再次光临,***(用户名)”。用户可以在线注册一个用户档案,并利用亚马逊获得专利的“单击设置”功能在线管理自己的用户信息。 (2)数据预处理 Web日志文件包含了各种没有经过处理的原始数据,其中有不完整的、冗余的、错误的数据,只有通过数据的清理和过滤,才是有分析价值的可靠信息。数据预处理可以获得客户会话文件或客户事务文件,该文件中包含了访问用户信息、请求页面的次序、访问时间等,为后续工作准备了数据基础。通常Web日志挖掘的预处理包括数据清理、客户识别、会话识别、路径补充、事件识别和格式化等处理过程。 (3)模式发现 对客户会话文件或事务文件运用关联规则分析、聚类分析等算法可以获得客户特征模式库。在今后客户浏览网页时,可以充分利用和分析客户的特征模式,掌握用户的特征和习惯,节省时间,提高效率,动态调整网页结构,主动满足客户需要的服务。亚马逊公司通过运用关联规则分析和聚类分析等算法,分析客户过去浏览历史信息,推测客户的爱好,然后筛选出对客户有用的信息。如根据客户以前购买的书籍种类推荐新书,当客户浏览某本书或某个音乐专辑是,基于Web的数据库将提供其他顾客的评论,并告诉顾客“购买该作者作品的顾客还购买了这些作者写的书……”。 (4)模式应用 Web日志挖掘得到的结果,可以应用于重构Web页面之间的链接关系以及页面的拓扑结构,实现个性化服务。 2.RSS技术在电子商务个性化服务中的应用过程如下: RSS是一种信息聚合的技术,是某一站点用来和其他站点共享内容的一种简易信息发布和传递的方式,使用户用更少的时间分享更多的网上信息资源。RSS通过XML标准定义内容的包装和发布格式,提供了一个实时、高效、安全和低成本的信息发布和快速获取信息的通道,其主要特点有以下几条: a.抗干扰。没有广告或者图片来影响标题或者文章概要的阅读。 b.信息汇聚。用户可以加入多个定制的RSS提要,将多个来源的信息整合到单个数据流中,而不用在这些网站或信息系统之间跳来跳去。 c.最新资料管理。自动更新你定制的频道网站内容,保持信息的即时性。 d.订阅方便快捷。订阅对应的频道只需在阅读器中输入频道地址,马上就能实现信息同步,退订时只要将频道从阅读器中删除即可,而不像邮件订阅需要许多烦琐的操作。 基于RSS的信息服务方式过程:当信息服务提供者向用户提供RSS时,通过RSS生成器,按照RSS规范的要求形成具有统一格式的RSS文档,称为RSS种子,并为RSS种子分配一个URL;浏览者有选择地订阅自己需要的RSS种子,通过RSS阅读器接收RSS种子信息,然后根据其中商品概要信息确定自己具体需要的内容,并通过其提供的链接获取目标页面。 RSS技术中提供个性化服务方式具体如下: (1)最新商品信息发布 使用RSS服务器,可以实现商品信息的自动更新。在网站的新商品发布页面上按商品分类放置RSS种子,甚至可以为每个商品生成RSS种子,生成的RSS种子包含商品常规信息,如当前的价格、商品描述、商品图片等。当商品信息变化时,只需修改种子源,相应放有种子的页面信息就同步变化 亚马逊就采用RSS技术实现了个性化内容定制服务。打开亚马逊的网站,就可以发现几乎所有种类的商品都已打包成相应的“RSS频道”,向客户终端的阅读器定期发送。通过RSS这个新渠道,亚马逊每当有新商品上市、新促销信息和重大新闻时,都能快速及时地将这些信息“推”向其客户,不仅给客户提供了方便,而且大大提高了这些信息的普及率、针对性和实效性。个性化推送服务RSS服务器可以根据客户个人浏览和购买商品的情况,充分了解客户的需求,提取客户兴趣特征信息,自动构建个性化服务的RSS种子,实现RSS个性化服务。RSS个性化服务可以过滤客户不需要的信息,自动通知客户所需要的预约商品- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 示例2 数据挖掘技术在电子商务中的应用 示例 数据 挖掘 技术 电子商务 中的 应用
咨信网温馨提示:
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【xrp****65】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【xrp****65】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【xrp****65】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【xrp****65】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。
关于本文