电商零售大数据分析云上实战.pdf
《电商零售大数据分析云上实战.pdf》由会员分享,可在线阅读,更多相关《电商零售大数据分析云上实战.pdf(42页珍藏版)》请在咨信网上搜索。
1、 2021,Amazon Web Services,Inc.or its Affiliates.李建伟 大数据技术专家电商零售大数据分析云上实战 2021,Amazon Web Services,Inc.or its Affiliates.议程电商行业现状数据驱动的电商业务场景非结构化数据搜索架构解析亚马逊电商案例 2021,Amazon Web Services,Inc.or its Affiliates.电商用户旅程个性化定制化首页产品推荐相关产品评分交叉销售客服我的订单修改订单问题客服搜索网页搜索图片搜索语音搜索移动搜索优化页面加载导航虚拟现实评分方式市场媒体语音移动设备渠道邮件广告地理
2、位置手机推送物流线上下单,店面提货线上下单,店面发货全球仓库派送预约派送第三方退货退货流程优化用户转化 售中用户触达 售前用户服务 售后兴趣/搜索 吸引/评估甄别/购买期待/追踪咨询/退货 忠诚/推荐 2021,Amazon Web Services,Inc.or its Affiliates.电商业务重点来源:eCommerce Leaders 2021 调查报告顾客终生价值(CLV)转化率优化(CRO)获客成本(CAC)新流量获取客单价(AOV)电商企业KPI电商企业投资重点网站/App性能优化个性化重构平台/无头电商全渠道优化产品发现和产品搜索70%52%51%51%47%2021,Am
3、azon Web Services,Inc.or its Affiliates.AmazonEMR商品搜索运营分析用户画像个性化推荐IT运维分析高阶应用的前置条件依赖于完善的数据湖建设和高效的数据处理无缝集成机器学习来构建用户画像数据驱动电商业务电商行业典型应用场景q 数据服务的深度和广度广泛的ML和AI服务AmazonRedshiftAmazon AthenaAWS GlueAmazon Elasticsearch ServiceAWS的价值主张q 五大场景,围绕用户旅程全链路典型机器学习范畴,是大数据分析的高级应用依赖于完善的数据湖进行数据预处理更加精准地触达客户、提高最终成单率依赖于商品
4、检索引擎架构及对应模块为分布式商品标识明确时,快速定位到目标对象为电商运营提供决定依据依赖于用户行为数据与RDS数据的多维度指标转化分析业务链条各环节数据电商客户的基本需求了解IT系统的整体运行状况,有效排查系统故障Amazon S3功能全面的存储层综合计算层高速可扩展的网络层99.999999999%水平的可靠性数据生命周期管理深度集成AWS Lake Formation 2021,Amazon Web Services,Inc.or its Affiliates.场景1:商品搜索 2021,Amazon Web Services,Inc.or its Affiliates.业务场景场景描述
5、 目标商品明确,可通过文字、语音、扫码等方式快速搜索到 商品搜索引擎架构具备分布式、可扩展的特性 数据在线下流程和线上流程均起到比较核心的作用数据特点 输入数据:通常,原始数据(结构化信息,文本、图像信息,动态信息等)来自前端数据库,数据源多个 搜索引擎:在数据采集方面更侧重于各种数据源的数据更新,其效果需要兼顾买家与卖家 输出数据:支持各种维度的排序,对数据的实时性要求非常高(主要体现在价格和库存两方面)业务实现 商品搜索引擎为功能实现的核心支撑,具备分布式、可扩展的特性,在架构中需要考虑对索引模块、查询模块和排序干预模块的解耦和分离,以方便对各个模块进行单独的优化和扩展 2021,Amaz
6、on Web Services,Inc.or its Affiliates.参考架构接口层服务层搜索意图商业规则个性化排序Amazon API GatewayAmazon DynamoDBAmazon AuroraAmazon MemoryDB for RedisAmazon OpenSearch ServiceAmazon OpenSearch ServiceAmazon OpenSearch ServiceAmazon SageMakerAWS LambdaElastic Load BalancingAmazon Elastic Kubernetes Service(Amazon EKS)
7、2021,Amazon Web Services,Inc.or its Affiliates.案例研究:Nike 耐克-商品检索痛 点Amazon ES的自动部署及管理工具大大简化了耐克的开发周期,加快了新搜索体验的上市时间。获 得 益 处解 决 方 案直接面向消费者业务的快速增长和扩张,迫切需要强大的商业搜索解决方案Amazon OpenSearch Service 服务作为耐克的核心搜索引擎“guys bred”意图:男士篮球鞋红黑色 2021,Amazon Web Services,Inc.or its Affiliates.全世界最大电商亚马逊的基石 A在AWS上面运行,使用Amazo
8、n OpenSearch Service扫描、读取和分析亚马逊市场数据,并且根据数据分析结果为买家和卖家提供服务一种完全托管的搜索引擎服务 为突增的并发访问量提供搜索引擎的稳定性和弹性按需付费和弹性预留以节省成本 Amazon OpenSearch Service允许电商客户在单个集群中存储多达3 PB的数据,并且可以根据需求变化轻松扩展或缩减容积;支持在三个可用区部署,使电商客户能够跨多个可用区部署实例AWS的优势和价值Amazon Elasticsearch Service高可用支持业务连续性 只需要按实际用量付费 与按需实例相比,预留实例可保留一或三年,大量节省使用成本内置开箱即用的KN
9、N算法 适用于Amazon OpenSearch Service 2021,Amazon Web Services,Inc.or its Affiliates.非结构化数据搜索架构解析 2021,Amazon Web Services,Inc.or its Affiliates.产品搜索基于文本产品搜索基于图片产品搜索“男士背包”输入:输入:2021,Amazon Web Services,Inc.or its Affiliates.Amazon Sagemaker 和OpenSearch构建图像检索构建图像检索Amazon Sagemaker图像分类模型训练部署特征提取模型Amazon Op
10、enSearchKNN邻近算法做邻近搜索高可用,安全的托管服务 2021,Amazon Web Services,Inc.or its Affiliates.图像检索原理查询图像预处理特征向量图像数据库图像特征库相似性比较索引+检索重排预处理检索结果 2021,Amazon Web Services,Inc.or its Affiliates.基于深度学习的图像特征提取Pretrained 模型去除最后做分类全连接层,留最后池化层做特征向量2048/4096维图像特征向量+7x7 ConvBatch Norm3x3 Max Pooling3x ResNet blocksGlobal Avera
11、ge Pool 2021,Amazon Web Services,Inc.or its Affiliates.图像图像检索架构检索架构1.通过SageMaker训练ResNet模型,将所有产品图片向量化2.将向量化的数据注入到OpenSearch索引中,其中图片数据用向量类型存储3.客户提交的图片调用SageMaker的推理服务,将单张图片转成向量数据4.调用OpenSearch KNN检索匹配最相似的K张图片5.记录用户的点击,购买等行为,训练Learning to Rank模型,优化排序结果 2021,Amazon Web Services,Inc.or its Affiliates.K-
12、NN search基于矢量的搜索算法使用特征提取或其他来创建特征向量使用矢量进行查询以检索几何上最接近的点几何相似或余弦相似 2021,Amazon Web Services,Inc.or its Affiliates.Learn to rank plugin机器学习的模型输入搜索结果的排名使用新近、受欢迎程度和偏好等功能将模型提供给Elasticsearch中的LTR插件LTR插件应用该模型,对搜索结果进行重新排序在循环中使用,反馈搜索结果并单击数据以改进模型DomainLTR PluginModelJudgment listTraining dataSearch resultsML Sys
13、temFeature setXGBoost,RankLibQueriesRe-rankedResults 2021,Amazon Web Services,Inc.or its Affiliates.Zalora产品搜索https:/ want to give our customers joy in shopping by just taking a photo of any fashion objects that grab their attention”Karthik Subramanian,CTO,Zalora GroupZALORA利用图片搜索提升用户体验,方便用户从大量的产品列表
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 零售 数据 分析 实战
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【宇***】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【宇***】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。