Web代理缓存替换策略和预取技术优化问题研究 毕业论文.pdf
《Web代理缓存替换策略和预取技术优化问题研究 毕业论文.pdf》由会员分享,可在线阅读,更多相关《Web代理缓存替换策略和预取技术优化问题研究 毕业论文.pdf(124页珍藏版)》请在咨信网上搜索。
1、分类号 密级UDC由堂暧2大学NANJING UNIVERSITY OF SCIENCE&TECHNOLOGY博士学位论文Web代理缓存替换策略和预取技术_优化问题研究 学位类别 工学博士学科名称 计算机科学与技术研究方向 计算机网络论文提交时间 2022年3月 _万方数据万方数据博士学位论文Web代理缓存替换策略和预取技术优化问题研究摘 要在互联网飞速发展的今日,互联网已成为人们日常生活中不可或缺的一部分,近年来,互联网信息总量和用户数量急剧膨胀,虽然互联网硬件基础设施建设有了长 足发展,但其能提供的网络带宽和网络服务能力还是有限的。于是人们开始积极研究 在现有的硬件条件下如何提高网络服务质
2、量。从而Web缓存(Web caching)技术应运 而生,Web缓存的基本思想是利用互联网访问时间和空间的局部特性,实现多次多 访问Web对象“取一次,用多次”的目的,将用户访问频率高的Web对象或未来可 能被访问的Web对象,缓存到离用户较近的Web缓存中,当用户访问时就可快速获 取,这样就可以减少冗余数据的传输,节约网络带宽资源、缓解服务器的网络负载压 力和缩短用户感知延迟的时间。由此,如何能更好得管理Web缓存成为了新的研 究热点,国内外研究归纳起来主要有两条技术路线:Web缓存替换策略和Web预取 技术。本文在两条技术路线上都进行了深入研究,然后融合两条技术路进一步展开研 究,取得了
3、一些有意义的成果。本文的主要研究工作和创新点如下:1)在Web缓存替换策略技术路线上,提出一种基于计数布谷鸟过滤器的热探测 方案,该方案具有良好的空间和时间效率。同时还提出了一种自适应两级LRU方案,可以利用热探测方案自适应调节两级LRU链长度。最后将计数布谷鸟过滤器热探测 方案和自适应两级LRU相结合,形成一种新的基于热探测方案的Web缓存替换策略。实验结果表明,该策略相比其它基于热探测方案的Web缓存替换策略,时间复杂度 和空间复杂度更小,缓存命中率良好的表现。2)在Web缓存替换策略技术路线上,还提出了一种适用于Web代理缓存的智能 缓存替换策略。该策略将逻辑回归算法与LRU相结合,形成
4、一种新的智能缓存替换 策略。通过对Web代理缓存日志的挖掘,获取影响Web缓存对象访问概率的特征值,利用逻辑回归算法建立模型,预测Web对象未来被访问的概率。同时引入L1正则化,来缩减特征值系数的绝对值,使得部分对模型影响较小的特征值系数接近于0,达到 筛选特征值的目的。实验结果表明,所提出的智能Web代理缓存替换策略对比经典 缓存替换策略和其它智能Web代理缓存替换策略,都能显著提高Web代理缓存性能。3)在Web预取技术路线上,提出一种基于分层分类算法的Web缓存预取模型,该模型能够在线学习,可以在现有层次结构中学习并更新分类模型,也可以自主增加 新的层次结构。同时还引入了输入向量在线归一
5、化和先验附加标签。输入向量在线归 一化,可以在不知道输入向量整体的情况下,在线归一化输入向量,使其赋值范围在。到1之间。同时采用先验标签的附加过程,可以反映层次之间类的依赖关系。实验 万方数据摘要博士学位论文结果表明,所提基于分层分类算法的缓存预取模型在时间复杂度、缓存命中率和预取 命中率上都要优于其它的预取模型。4)融合Web缓存替换策略和Web预取技术路线,提出了一种集成Web预取技术 和Web缓存替换策略的缓存方案,通过制定了一个规范化的利润函数,来确定缓存 Web对象的标准化的利润,通过利润大小结合Web缓存替换策略来确定预取和驱逐 Web对象的方案。实验结果表明,在缓存命中率和预取命
6、中率上,所提方案能有效 提高Web预取模型的性能。关键词:Web缓存替换策略、Web预取技术、布谷鸟过滤器、逻辑回归算法、Fuzzy ARTMAP算法、利润函数万方数据博士学位论文Web代理缓存替换策略和预取技术优化问题研究AbstractWith the rapid development of the Internet,the Internet has become an indispensable part of peoples daily life.In recent years,the total amount of Internet information and the numb
7、er of users have expanded rapidly.Although the construction of Internet hardware infrastructure has made great progress,the network bandwidth and network service capacity can be provided are still limited.So people began to actively study how to improve the quality of network service under the exist
8、ing hardware conditions.Thus Web caching technology emerges.The basic idea of Web caching is Htake once,use more than once”.By using the local characteristics of Internet access time and space,users can cache web objects with high frequency of access or web objects that may be accessed in the future
9、 into the web cache near users,which can be obtained quickly when users access,In this way,redundant data transmission can be reduced,network bandwidth resources can be saved,network load pressure of server can be relieved and the time of user perception delay can be shortened.Therefore,how to manag
10、e Web cache better has become a new research hotspot.There are two main technical routes in domestic and foreign research:Web cache replacement strategy and web prefetch technology.In this paper,the two technical routes are studied in depth,and then the integration of the two technical routes for fu
11、rther research,and achieved some meaningful results.The main research work and innovation of this paper are as follows1)On the technical route of Web cache replacement strategy,a counting cuckoo filter hot-probe method is proposed,which exhibits a high space and time efficiency.At the same time,an a
12、daptive two-level LRU scheme is proposed,which can adaptively adjust the length of two-level LRU chain by using the hot-probe method.Finally,a new web cache replacement strategy based on hot-probe method is formed by combining counting cuckoo filter hot-probe method with adaptive two-level LRU.Exper
13、imental results show that compared with other web cache replacement strategies based on t hot-probe method,this strategy has less time complexity and space complexity,and higher cache hit rate.2)On the technical route of Web cache replacement strategy,an intelligent cache replacement strategy suitab
14、le for web proxy cache is proposed.This strategy combines the LRU with the logistic regression algorithm to form a new intelligent cache replacement strategy.Through the mining of web proxy cache logs,the eigenvalues that affect the accessin 万方数据Abstract博士学位论文probability of Web cache objects are obt
15、ained,and the model is established by using logistic regression algorithm to predict the future access probability of Web objects.At the same time,LI regularization is introduced to reduce the absolute value of the eigenvalue coefficients,so that some of the eigenvalue coefficients which have little
16、 influence on the model are close to 0,so as to achieve the purpose of screening eigenvalues.Experimental results show that the proposed intelligent web proxy cache replacement strategy can significantly improve the performance of web proxy cache compared with the classic cache replacement strategy
17、and other intelligent web proxy cache replacement strategies.3)On the technical route of Web Prefetching,a web cache prefetching model based on hierarchical classification algorithm is proposed.The model can learn online,learn and update the classification model in the existing hierarchy,and add new
18、 hierarchy independently.At the same time,the online normalization of input vectors and a priori tag are introduced.Input vector online normalization can normalize the input vector online without knowing the whole input vector,so that its assignment range is between 0 and 1.At the same time,the addi
19、tional process of a priori label can reflect the dependency relationship between classes.Experimental results show that the proposed cache prefetching model based on hierarchical classification algorithm is superior to other prefetching models in time complexity,cache hit rate and prefetching hit ra
20、te.4)Integrating web cache replacement strategy and Web Prefetching technology route,a caching scheme integrating Web Prefetching technology and Web cache replacement strategy is proposed.A standardized profit function is formulated to determine the standardized profit of caching web objects,and the
21、 scheme of prefetching and expelling web objects is determined by profit size combined with Web cache replacement strategy.Experimental results show that the proposed scheme can effectively improve the performance of Web Prefetching model in terms of cache hit rate and prefetching hit rate.Key word:
22、Web cache replacement strategy,Web Prefetching technology,Cuckoo filter,Logical regression algorithm,Fuzzy ARTMAP algorithm,Profit functionIV万方数据博士学位论文Web代理缓存替换策略和预取技术优化问题研究目 录摘 要.IAbstract.Ill目 录.V图表目录.IX1绪论.11.1 研究背景与意义.11.2 Web 缓存.21.3 Web缓存替换策略.41.3.1 Web缓存替换策略.41.3.2 经典Web缓存替换策略分类.51.3.3 智能Web缓
23、存替换策略.71.4 Web缓存预取技术.71.4.1 Web缓存预取技术分类.81.4.2 Web代理缓存预取技术.91.4.3 Web代理缓存预取模型分类.101.5 本文涉及数据集介绍.121.6 本文研究主要内容.121.7 本文结构安排.142基于计数布谷鸟过滤器热探测方案的Web代理缓存替换策略.172.1 弓I 言.172.2 相关工作.182.2.1 基于计数布隆过滤器的热探测机制.192.2.2 布谷鸟过滤器.202.2.3 LRU缓存替换策略.212.3 模型设计.212.3.1 基于计数布谷鸟过滤器热探测方案.212.3.2 CCF-LRU缓存替换策略.242.4 CBF
24、和CCF错误率分析与参数设置.262.5 性能评估.282.5.1 缓存替换策略评价指标.28v万方数据目录博士学位论文2.5.2 CCF-LRU 性能分析.282.5.3 CCF-LRU和其它类型LRU改进算法对比.342.6 本章小结.343基于逻辑回归算法的智能Web代理缓存替换策略.373.1 弓I 言.373.2 LR-LRU智能缓存替换策略.383.2.1 L1正则化LR算法.383.2.2 LR-LRU智能缓存替换策略.403.2.3 LR-LRU智能缓存替换策略框架.403.3 数据预处理和特征值提取.413.3.1 数据预处理.413.3.2 特征值提取.423.4 L1-L
25、R模型建立.433.4.1 模型训练.433.4.2 L1-LR特征值筛选和模型建立.433.5 效果评估与探讨.463.5.1 L1-LR 模型验证.463.5.2 替换策略评价指标.473.5.3 LR-LRU缓存替换策略和经典缓存替换策略对比.483.5.4 LR-LRU缓存替换策略和其它智能缓存替换策略对比.513.6 本章小结.524基于分层分类Fuzzy ARTMAP算法Web代理缓存预取技术.534.1 弓|言.534.2 相关工作.544.2.1 ART自适应共振网络.554.2.2 ART网络运行原理.574.2.3 Fuzzy ARTMAP 网络.584.3 HC-FAM
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- Web代理缓存替换策略和预取技术优化问题研究 毕业论文 Web 代理 缓存 替换 策略 技术 优化 问题 研究
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【曲****】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【曲****】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。