基于个性化特征的无公害农产品目录智能服务系统.pdf
《基于个性化特征的无公害农产品目录智能服务系统.pdf》由会员分享,可在线阅读,更多相关《基于个性化特征的无公害农产品目录智能服务系统.pdf(9页珍藏版)》请在咨信网上搜索。
1、第 29 卷 第 20 期 农 业 工 程 学 报 Vol.29 No.20 142 2013 年 10 月 Transactions of the Chinese Society of Agricultural Engineering Oct.2013 基于个性化特征的无公害农产品目录智能服务系统 席 磊1,2,郑 光1,2,汪 强1,2,庞晓丹1,2,丁保华3,马新明1,2,4(1.河南农业大学信息与管理科学学院,郑州 450002;2.农业部黄淮海农业信息化技术科学观测站,郑州 450002;3.农业部农产品质量安全中心,北京 100028;4.河南农业大学农学院,郑州 450002)摘
2、 要:从促进无公害农产品流通,提高认证产品信息服务质量出发,该文以无公害农产品目录为研究对象,以实现认证产品信息的个性化检索与推荐为目标,进行产品目录智能服务的关键技术研究。以产品概念、属性和语义关系为主体,设计产品目录本体模型,建立产品目录领域本体,形成无公害农产品电子化目录;基于产品目录领域本体,从本体概念层面进行用户兴趣特征建模,采用语义清晰度与用户兴趣度的综合值设置概念权值,建立个性化产品目录加权本体模型,并设计个性化产品目录加权本体建立算法,实现用户兴趣的动态、准确和全面描述;通过个体过滤、综合过滤、概念映射、语义查询扩展和查询结果优化,构建个性化产品目录信息推荐与检索算法,建立产品
3、目录智能服务系统。在检索结果用户满意度对比试验中,相比于基于领域本体检索、基于语义相似度优化检索和基于个性化本体优化检索 3 种方式,分别提高了 31%、21%和 14%,结果表明可在一定程度上提高无公害农产品目录信息检索推荐的质量和满意度,满足个性化的需求,同时也可为无公害农产品推广、品牌化销售和电子化交易提供技术支撑,具有较好的应用前景。关键词:信息服务,信息检索,本体,无公害农产品,产品目录,个性化,智能服务 doi:10.3969/j.issn.1002-6819.2013.20.020 中图分类号:S126;TP274 文献标志码:A 文章编号:1002-6819(2013)-20-
4、0142-09 席 磊,郑 光,汪 强,等.基于个性化特征的无公害农产品目录智能服务系统J.农业工程学报,2013,29(20):142150.Xi Lei,Zheng Guang,Wang Qiang,et al.Intelligent service system of pollution-free agricultural products catalog based on personalized featuresJ.Transactions of the Chinese Society of Agricultural Engineering(Transactions of the C
5、SAE),2013,29(20):142150.(in Chinese with English abstract)0 引 言 无公害农产品认证1经过十多年的发展,认证产品数量迅速增加,“十二五”期间,无公害农产品生产面积将达到全国产地总面积 60%,产品数量达到 7 万个。随着公众消费行为愈加成熟,对无公害农产品的接受程度和获取产品信息的需求逐步提高,因此开展了无公害农产品认证资源共享服务的研究2-4。但随着认证产品数量的愈渐增多,产品目录会随之变得愈加庞大,因此产品目录的合理组织,将直接影响产品信息服务的效率和价值。此外,产品信息需求对象浏览产品的目的、兴趣不同,往往只对小部分产品感兴趣,
6、导致大量产品信息与用户个性化需求之间的矛盾。本体提供了概念语义描 收稿日期:2013-02-01 修订日期:2013-08-02 基金项目:国家 863 计划项目(2006AA10Z270)作者简介:席 磊(1972),男,河南新乡人,副教授,主要从事农业信息化关键技术研究及农产品质量安全控制。郑州 河南农业大学信息与管理科学学院,450002。Email: 通信作者:马新明(1963),男,河南许昌人,教授,博士生导师,主要从事精准农作与信息技术研究。郑州 河南农业大学农学院,450002。Email: 述以及知识重用与共享,使它在信息检索、自然语言理解、语义研究等领域得到了广泛应用5-8,
7、也成为产品目录建模的主要方法9;而个性化服务通过信息特征建模、用户兴趣建模10-11和信息过滤12-14等关键技术可以实现信息按需服务的目标,在搜索引擎、电子商务等领域存在很多个性化服务系统15-17。因此通过优化设计无公害农产品目录,为产品信息检索与推荐提供基础,同时引入个性化信息技术,提供满足个性化偏好的产品目录,使用户以最少的时间获取更多的所需信息,这将有助于改善无公害农产品信息服务的实际操作性和经济性。本文以无公害产品目录为研究对象,以实现针对不同用户生成多样化的产品目录、提供满足用户兴趣需求的产品信息智能检索与推荐为目标,构建无公害农产品目录智能服务系统。系统通过建立无公害产品目录本
8、体,对产品信息特征进行形式化的语义表示,根据用户信息浏览内容,基于产品目录本体进行用户兴趣建模,建立个性化产品目录加权本体,同时设计个性化产品目录信息检索与推荐算法,实现向使用者提供高质量、有针对性的信息,提升产品信息服务质量。第 20 期 席 磊等:基于个性化特征的无公害农产品目录智能服务系统 143 1 材料与方法 1.1 无公害农产品目录领域本体 基于领域本体以及产品目录建模的相关研究9,18-19,无公害农产品目录领域本体是在产品分类的基础上,通过定义产品概念、产品属性进行构建。目录本体由产品分类概念与产品概念构成,由于可能出现新的产品分类体系,分类概念与产品概念通过映射建立语义关系,
9、此外无公害农产品仅为未加工或初加工产品,产品间缺乏必然的关联,产品概念间不做语义关系定义。领域本体元模型如图1a,领域本体片段如图 1b 所示。a.产品目录领域本体元模型 a.Ontology meta-model of the product catalogue domain NY5320-2005 农业行业标准 无公害食品多年生蔬菜 NY5320-2005 agriculture industry standard Non-pollution food perennial vegetables NY5115-2002 农业行业标准 无公害食品大米 NY5115-2002 agricultu
10、re industry standard Non-pollution food perennial rice NY5089-2005 农业行业标准 无公害食品绿叶菜类蔬菜 NY5089-2005 agriculture industry standard Non-pollution food green leafy vegetables b.产品目录领域本体片段 b.Fragment of product catalogue domain ontology 图 1 无公害农产品领域本体元模型与本体片段 Fig.1 Domain ontology meta-model and ontology
11、fragment of pollution-free agricultural products 1)无公害农产品是指必须符合规定的质量标准和规范的产品,因此基于认证适用标准,结合食用农产品分类进行无公害农产品 5 级分类定义:一级类(A 类),按照无公害认证产品类型,分为种植业、畜牧业和渔业 3 个类别;二级类(B 类),基于食用农产品范围注释20,种植业分为粮食、茶叶、油料植物等 8 个类别,畜牧业分为肉类、蛋类、奶制品等 5 个类别,渔业分为水产动物、水生植物和水产综合利用初加工品 3 个类别;三级类(C 类),依据无公害农产品认证适用标准,形成 128 个类别;四级类(D 类),根据无
12、公害农产品认证产品目录,共形成 815 个产品类别。分类间通过定义 PR(partner relation)类属、SR(synonymy relation)同义等关系形成产品分类语义树。2)利用无公害农产品认证资源提供产品基本信息与生产信息的完备性2,定义产品目录本体属性集包括通用属性集和认证属性集。其中,通用属性集定义产品名称、申报法人、注册商标、联系方式、产地、证书编号等 6 个子属性;认证属性集定义产地认定产品认证申请书、质量控制措施、生产操作规程、产地环境报告、产品检验报告、申报法人资质证明等 6 个子属性,所有子属性均为数值属性,属性值基于文献2,通过编码自动获取。1.2 个性化产品
13、目录加权本体模型 个性化产品目录加权本体模型(个性化加权本体模型)即用户兴趣模型,是从领域本体概念层面对用户兴趣的形式化描述,定义为 3 元组:UI,PF,IC。其中,UI表示用户信息;PF 表示用户个性化特征;IC 表示用户兴趣特征。1)兴趣特征,反映了用户感兴趣的产品实例,它为个性化特征的建立提供数据源,定义为IC=IB,IFre,IT。其中,IB 是感兴趣产品实例集合,IFre是兴趣实例被触发的频次集合,IT 是兴趣实例最近访问日期的集合。2)个性化特征,反映了用户感兴趣的产品类及其兴趣程度,定义为 PF=PO,CW,CT。其中,PO 为个性化本体;CW 为各级产品类的个性化权值集合,表
14、示用户兴趣程度;CT 为权值更新日期的集合。产品类个性化权值的确定,采用产品类的语义清晰度与用户兴趣度的综合值。用户对某一产品类发生兴趣,必然频繁访问属于该类的产品实例,因此产品类对用户的重要程度与该类兴趣实例数量成正比;而产品类语义越清晰越具体,对用户越有利用的价值,因此产品类对用户的重要程度也与其清晰度成正比。产品类个性化权值 W(C)定义如下 W(C)=WSem(C)WInt(C)(1)WSem(C)=WSem(Ci)+1 (2)农业工程学报 2013 年 144 WInt(C)=|1/ln(m/M)|(3)式中,Wsem(C)为产品类C的清晰度,由其所在的语义层次决定,根据产品目录本体
15、,在产品分类路径中,设产品类清晰度随语义层次的递进以步长 1 递增,顶级产品类语义清晰度为 0;WInt(C)为产品类C 的用户兴趣度;M表示产品类C具有的实例数量;m 表示产品类 C 中兴趣实例的数量。1.3 个性化产品目录加权本体构建算法 基于个性化加权本体模型,个性化产品目录加权本体(个性化本体)由目标用户本体和综合用户本体构成,利用它可以为用户呈现只包含满足需求的产品目录信息。1.3.1 目标用户个性化产品目录加权本体 目标用户个性化产品目录加权本体(目标用户本体)是对单个用户的产品目录个性化特征具体表达,如图 2 所示。图 2 目标用户个性化产品目录加权本体片段 Fig.2 Weig
16、hted ontology fragment of target users personalized product catalogue 目标用户本体初始为空,它是在捕捉用户感兴趣产品实例的过程中,通过学习用户兴趣和更新用户本体动态建立起来。兴趣学习和本体更新是在用户完成一次产品目录检索浏览后,被自动触发,由兴趣捕获,本体投影、归并本体和本体剪枝完成,如图 3 所示。其中,兴趣捕获与本体投影实现兴趣学习,归并本体与本体剪枝实现本体更新。1)兴趣捕获,采用基于内容的隐式收集方式,领域本体中认证属性集为用户提供详细的产品信息,若用户对某个产品有较大兴趣就会花精力去浏览其认证子属性。因此当用户浏览
17、实例认证子属性的数目大于设定阈值,则当前产品实例被触发为兴趣实例,并将其通用属性、触发时间和触发频次动态记录到用户兴趣特征库中。2)本体投影,根据本次兴趣特征,基于领域本体,获得其映射四级产品类(D 类),依据类属关系逐次对产品类进行上位扩展,形成产品类分类路径树,并根据式(1)计算各产品类个性化权值,建立起本次学习更新的参考本体。图 3 目标用户加权本体建立的算法流程 Fig.3 Establishment flow of target user weighted ontology 3)归并本体,是将参考本体合并到目标用户本体,并更新目标用户本体个性化权值的过程。权值更新依据产品类共现情况进
18、行:非共现产品类是指该产品类仅出现在参考本体中,此时将该产品类和权值作为新产生的个性化特征项直接加入到目标用户本体中。共现产品类是指参考本体中的产品类已存在于目标用户本体中,此时仅作权值更新处理。依据用户兴趣衰减特性,采用渐进遗忘的方法,综合用户长期兴趣与短期兴趣进行权值更新,定义如式(4),WLt(C)是产品类 C 在目标用户本体中的权值,表示用户长期兴趣;WSt(C)是产品类 C 在参考本体中的权值,表示用户短期兴趣;(/)t h+是兴趣衰减因子,t表示 2 次更新间隔天数,h表示半衰期(一般取值为 7),为调整系数,控制衰减速度。()()()(/)LtStW CWCWCt h=+(4)对
19、于目标用户本体中未进行权值更新的产品类,在归并过程中一并进行,同样采用渐进遗忘的第 20 期 席 磊等:基于个性化特征的无公害农产品目录智能服务系统 145 方法,通过式(4)对产品类个性化权值进行更新,此时短期兴趣 WSt(C)=0。4)本体剪枝,是从优化模型角度,将低兴趣的产品类从目标用户本体中移除。剪枝规则定义如下:当 D 类产品类个性化权值小于设定阈值时,则产品类与其兴趣特征从本体中剪除;对于 A 类、B类或和 C 类产品类,当其子类为空时,则从本体中剪除。1.3.2 综合用户个性化产品目录加权本体 构造用户邻居集合有助于提高信息服务质量21-24。综合用户个性化产品目录加权本体(综合
20、用户本体)是对目标用户及其最近邻用户的兴趣综合,相对与目标用户本体,所包含的兴趣更广泛,利用它能有效扩充目标用户的个性化特征,使目标用户发现新的兴趣。综合用户本体建立,由目标用户触发,通过构建最近邻集合和归并最近邻本体完成,如图4 所示。图 4 综合用户加权本体建立的算法流程 Fig.4 Establishment flow of comprehensive user weighted ontology 构建最近邻用户集合是以选定的目标用户为中心,进行用户聚类的过程,基本流程如下:1)依据各用户本体,提取 D 类产品类及其权值,建立各用户个性化特征标量;2)采用欧式距离计算各用户与目标用户标量
21、的相异度;3)按照最小距离原则,进行相异度排序,确立最近邻用户,建立目标用户最近邻集合。归并最近邻本体是将目标用户本体初始化为综合用户本体,再使用最近邻用户本体,对其进行更新的过程,基本流程如下:1)采用极差标准化方法规格化最近邻用户相异度;2)以规格化后的相异度为权重,加权修正最近邻用户本体中的个性化权值,产生经过修正的最近邻用户个性化本体副本;3)基于最近邻用户个性化本体副本,按产品类分类层次,进行最近邻用户本体的归并,建立起各层次产品类集合;4)读取目标用户本体,进行综合用户本体初始化;5)采用多叉树层次遍历算法,将各层次产品类集合归并到综合用户本体,综合用户本体产品类个性化权值取值为归
22、并过程中相应产品类权值的均值。1.4 个性化产品目录信息检索 依据个性化检索技术的相关研究25-28,采用基于本体的语义检索与个性化检索相结合的方法,实现个性化产品目录信息检索。算法由概念映射、语义查询扩展和查询结果优化构成,其思想是首先由概念映射将检索关键词转换为本体中的产品类,然后由语义查询扩展将转换后的产品类进行概念扩充,最后综合产品类语义相似度、个性化权值以及实例相似度计算实例匹配度,进行查询结果优化,从而达到将用户更感兴趣的实例排序在越靠前的位置,检索算法流程如图 5 所示。图 5 个性化产品目录信息检索算法流程 Fig.5 Retrieval flow of personalize
23、d products catalog information 1.4.1 概念映射 概念映射是获得与查询关键词相匹配的产品农业工程学报 2013 年 146 类。采用关键词匹配策略,基于领域本体,利用同义关系,将每一检索关键词 ki,转化成本体中的产品类,建立起由产品类构成的查询集合,未匹配的关键词,反馈给用户进行调整。1.4.2 语义查询扩展 语义查询扩展是对查询集合中的产品类进行扩充,达到检索结果更为全面的目的。基于领域本体中产品类间的语义关系,对产品类进行同位节点、下位节点的扩展,同时计算扩展产品类与查询产品类的语义相似度,从而找到与查询语义主旨相关的产品类。基本流程如下:1)基于个性化
24、本体,将查询集合中的产品类按权值大小排列成查询产品类优先权队列作为输入 Input;2)每次取出产品类优先权队列头节点,基于领域本体对其进行同位节点查询扩展,建立同位节点产品类队列;3)每次从同位节点产品类队列取出头节点,基于领域本体,对其进行下位节点查询扩展,即沿着节点的每一条边,取出与之关联的 D 类产品类,计算扩展产品类与查询产品类的语义相似度,并将扩展产品类加入输出结果集 output;4)重复步骤 2)和 3),直到 Input 队列为空,最终得到由 D 类产品类构成的扩展集合 Output;5)对 Output,按照语义相似度进行产品类排序,删除语义相似度小于设定阈值的概念。产品类
25、间语义相似度按照式(5)进行计算1),(1),(2+=CCdCCSimiisem (5)其中,d(Ci,C)为产品类 Ci与 C 间的距离,当 Ci与 C是同支时,设 C 是 Ci的祖先,则 d(Ci,C)=dep(C)dep(Ci);当iC与C不是同支时,设A是C与Ci的最小共同祖先,则d(Ci,C)=dep(C,A)dep(Ci,A)。1.4.3 查询结果优化 从扩展集合,通过产品类与产品实例映射关系,可获得初始产品实例集,查询结果优化是对每一实例进行匹配度计算,并依据匹配度由大到小对实例集进行排序。实例匹配度由 3 部分构成,计算如式(6)(,)()(,)semiiinsMatchSim
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 个性化 特征 公害 农产品 目录 智能 服务 系统
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【二***】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【二***】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。