基于数字化的邮政金融大众客户价值提升研究.pdf
《基于数字化的邮政金融大众客户价值提升研究.pdf》由会员分享,可在线阅读,更多相关《基于数字化的邮政金融大众客户价值提升研究.pdf(7页珍藏版)》请在咨信网上搜索。
1、第40 卷第1期2024年1月DOl:10.13955/j.yzyj.2024.01.05.07邮政研究StudiesonPostsVol.40 No.1Jan.2024基于数字化的邮政金融大众客户价值提升研究范峻川1,连耀山1,蔡亚琦,鹿琦,郭浩,张谭1.中国邮政集团有限公司金融业务部,北京2.中邮信息科技(北京)有限公司,北京3.中国邮政储蓄银行数据管理部,北京10 0 16 0 100808;101111;摘要:依托XGBo0st模型,利用2 0 2 1年1一12 月邮政金融客户资产信息、负债信息、账户特征信息、交易信息等数据进行研究,结果表明:客户活跃度、财富管理分别是影响AUM01万
2、元低资产客户盘活、AUM5万10 万元VIP临界客户价值提升的关键影响要素。根据模型结果,提出邮政金融应“精耕存量”与“广拓增量”相结合,开展“低效盘活行动”“临界跃升行动”“新客倍增行动”的发展建议。关键词:邮政金融;大众客户;XGBoost模型;低效客户;客户价值中图分类号:F61文献标识码:A企业经营的目的在于创造客户。依托数字化,可以挖掘大众客户潜能,降低客户运营成本、提升客户价值。客户是邮政金融经营发展的“根”和“本”,根深才能叶茂,本固方有枝荣。邮政金融拥有海量的个人客户,其中大部分均为客户总资产(AUM)低于10 万元的大众客户,如何通过大数据洞察其需求、深挖其潜能,成为邮政金融
3、大众客户经营呕待解决的问题。本文以XGBoost模型为基础,从AUM01万元、AUM5万10 万元两个层级对大众客户展开模型分析,并根据相应结论提出营销建议。1研究背景目前大部分长尾客户仍游离于服务盲区,聚焦长尾客户经营时不我待。受制于海量客户、高作者简介:范峻川(19 9 1一),男,山东宁津人,硕士,经济师,主要从事邮政金融客户经营、储蓄存款发展、宏观经济政策等研究;连耀山(19 7 4一),男,福建莆田人,博士,高级经济师,研究员,主要从事邮政金融客户经营管理、银行业务、协同发展研究;蔡亚琦(19 9 0 一),女,湖北汉川人,硕士,主要从事金融行业数据分析建模研究;鹿琦(19 9 3一
4、),男,安徽芜湖人,硕士,主要从事金融统计分析、机器学习研究;郭浩(19 8 9 一),男,河南郑州人,硕士,主要从事机器学习建模及业务落地、算法创新等研究;张谭(19 9 0 一),女,河北昌黎人,硕士,主要从事金融行业研究。收稿日期:2 0 2 3-10-17品质服务和有限成本三者之间的矛盾,低资产长尾客户价值挖掘和精准提升一直是商业银行经营的痛点和难点,也是邮政金融营销的“灯下黑”:数量占比9 4.3%的AUM10万元以下邮政金融客户,总资产只占邮政金融全量AUM的2 4.9%;邮政金融人均存款仅1.8 万元,而全国人均存款为9.4万元。如此巨大的人均资产差距,意味着很多客户在邮政金融是
5、低资产客户,在他行却可能是VIP、财富客户。科技赋能精准分层分群分类营销,已悄然成为邮政金融客户经营的“必答题”。近年来,同业纷纷强化有效客户的营销拓展,“客户”已然成为2022年各家商业银行半年报的高频词汇;工商银行、农业银行、建设银行等同业2 0 15 一2 0 2 1年个人有效客户年均增幅均高于5%,而邮政金融仅为本刊网址:29第1期4%,邮政金融通过科技赋能精准分层分群分类营销势在必行。长尾客户经营不止是新增的“一隅”,更是关联各项业务新增的“全域”。很多业务发展乏力的背后,都离不开长尾客户新增乏力的“影子”。伴随着邮政金融个人有效客户新增乏力,快捷支付交易额、手机银行净增激活客户数也
6、在边际下滑。邮政金融呕待以低资产客户经营质效提升,助力各项业务高速高质量增长。2文献综述大众客户的精耕、深耕已成为共识,很多同业通过构建标签、调研问卷、回归模型和聚类分析等方式对商业银行大众客户经营展开了研究和实践,但邮政金融对于大众客户画像与模型构建尚处于空白。有专家提出了基于客户基本信息标签、资产信息标签、内容偏好标签、回话标签等多维、融合客户画像的建模思路;有专家通过调查问卷与经验总结的方式,发现建设银行一些分行长尾客户经营存在的问题,并从细化客户需求、提升客户价值等方面提出建议;也有专家基于Logistic回归模型,对某银行分行客户流失情况进行研究,结果表明开户时长、年龄、性别、人民币
7、活期储蓄波动率、人民币定期月均余额等方面对商业银行客户流失情况存在影响;还有专家则更进一步,通过聚类分析的方法,将工商银行贵州分行长尾客户分为五类,认为长尾客户数量多、分布广,建议采用线上营销方式来实现长尾客户的活客黏客。3实证分析3.1实实证分析框架本文基于邮储银行大数据平台中邮政金融邮政研究010 万元客户数据,通过特征工程解决数据一致性、可用性问题后,基于逻辑回归和相关性分析确定变量,通过调优后的XGBoost模型重要性指标分析,得出分析结论(见图1)。3.2数据分析3.2.1AUM01万元低资产客户低资产客户盘活的关键在于“促活”。从柜面交易看,AUM01万元低资产客户6 个月内有柜面
8、交易客户占本资产段客户比重为9.6%,分别低于AUM1万10 万元、10 万5 0 万元客户26.7个百分点和46.7 个百分点;从手机银行交易看,仅1.4%的AUM01万元低资产客户30 天内手机银行有动账交易,而AUM1万10 万元、10万5 0 万元、5 0 万6 0 0 万元客户则分别占比4%、6.4%和18.6%;从客户快捷支付活度看,17.6%的AUM01万元低资产客户近9 0 天内有快捷支付交易,分别低于AUM1万10 万元、10 万5 0万元、5 0 万6 0 0 万元客户占比10.1个百分点、13.1个百分点和2 3.7 个百分点。3.2.2AUM5万10 万元VIP临界客户
9、临界客户提升的重点是“财富管理”。从单一存款客户占比看,AUM10万元以下客户单一存款客户占比均值为9 4.2%,AUM10万元以上客户则下降到6 3%左右的水平,尤其是AUM600万元以上的私行客户,其单一存款客户占比仅为5 4.9%;从理财产品持有情况看,AUM10万元以下客户理财产品渗透率均低于1%水平,而AUM10万元以上、AUM50万元以上VIP、财富客户则逐步攀升,达到 1.6%和 2.2%.3.3数据准备3.3.1数据来源为丰富客户维度,精细化用户画像,中国邮第40 卷数据探查特征工程逻辑回归相关性分析确定变量模型构建数据提取模型训练模型调优重要性结论分析图1大众客户价值提升建模
10、框架一330XGBoost模型第1期政基于总行数据实验室环境,从主仓、新中间业务平台、客户集市等系统,以客户号为主键,将客户资产信息、负债信息、账户特征信息、交易信息等数据进行加工,36 0 度挖掘客户信息,生成模型可用变量。经过数据筛选、关联匹配、统计分析等操作,最终共提取6 大类46 5 项指标特征。综合对2021年7 一9 月10 万元以下客户的46 5 个指标与提升标签(因变量值)进行相关性分析,最终分别选取涵盖客户年龄、取款次数、资产等级、客户账户数、账龄、转账时间间隔、保险金额占AUM比例、定期存款占AUM比例、快捷支付、手机银行等为代表的6 9 个指标作为AUM01万元低资产客户
11、盘活模型的有效指标,涵盖客户基本信息、产品信息、交易信息、交易习惯等全维度的9 4个指标作为AUM5万10 万元VIP临界客户提升模型的有效指标。3.3.2特征工程识别有效客户:对客户身份证号进行清洗,对长度、出生日期存在异常的身份证号进行筛除。规范客户号:删除格式不规范的异常客户号及相关信息。识别异常值:观察各特征的数值范围和形式,按照数据分布情况,剔除异常极值、负值等,规避异常值对建模的负面影响。不可识别特征处理:识别不同类型的数据,将数值型特征、字符型特征、日期型特征分别进行规范,对不可识别的特征值进行转化、剔除。时间日期类数据处理:将日期型变量转为距某特定日期的天数,转为数值型特征。字
12、符型数据处理:对性别、教育水平、职业代码等字符型特征进行独热编码(One-HotEncoding),转为哑变量(0,1),将其处理成模型可识别的数据。空值填充:对年龄、性别标签字段,根据身份证号计算年龄、性别信息,对缺失值进行填充补全;将交易金额、交易笔数等资产类数值型特征的缺失值填充为0;对时间差等数据特征(如最近一次交易行为距某天间隔时长)的空值,为便于机器识别,对其填充为无限大值9 9 9 9 9 9。3.3.3数据检验卡方检验是一种常用的统计假设检验方法,其基本思想是通过比较样本实际观察结果与理论推一31范峻川等:基于数字化的邮政金融大众客户价值提升研究H。:变量间相互独立Hi:变量间
13、不独立(相关)卡方值计算公式为:2=Z4-E-24-mEnp其中,E代表期望频数,A,为特征i实际观测值,P,为特征i在H。假设前提下的概率,k为样本数。样本自由度n=(R-1)(C-1),其中R为y值的分类数量,C为特征指标的分类数量。若假设H。为指标与因变量无显著关系,则AUM01万元低资产客户盘活模型、AUM5万10 万元VIP临界客户提升模型中的6 9 个指标、94个指标P值均接近于0、远小于0.0 5 的显著性水平,因此有理由拒绝原假设H。,可认为6 9 个指标、9 4个指标均与因变量(V值)存在显著关系,符合模型构建的效度要求。3.4AUM01万元低资产客户盘活模型构建XGBoos
14、t 模型全称为 Extreme Gradient Boosting,可译为极限梯度提升算法,是一种基于决策树算法的梯度提升机(GradientBoostingMachine,GBM),为当前最为流行和高效的机器学习提升算法之一,其特点是执行速度快、模型效果好、适用范围广。XGBoost是一种采用集成学习算法的加法模型。集成算法通过在数据上构建多个弱评估器,汇总所有弱评估器的建模结果,以获取比单个模型更好的回归或分类表现。首先使用一个弱分类器(CART决策树)作为初始函数,然后采用Boosting集成思想,通过不断添加分类器来逐步降低损失函数值,每一步都尽量优化和改进前一步的预测。对于XGBoo
15、st来说,每个叶子节点上都会有一个预测分数,也被称为叶子权重。这个叶子权重就是所有在这个叶子节点上的样本在这一棵树上的取值,用 f(x)或w来表示,第40 卷断结果的差异,来检验分类变量之间是否存在关联或两变量是否独立。具体来说,卡方检验首先根据研究假设,计算出理论上期望出现的频数分布,然后统计样本的实际观测频数,最后计算实际频数与期望频数之间差异的平方和,即卡方统计量。如果样本结果与理论预期存在较大差异,卡方值就会较大;如果两者吻合,卡方值就会较小。通过与理论卡方分布进行比较,就可以推断差异是否具有统计学意义。在此基础上提出原假设和备择假设如下:第1期其中f表示第k棵决策树,x表示样本i对应
16、的特征向量。当有多棵树的时候,集成模型的回归结果就是所有树的预测分数之和,假设这个集成模型中总共有k棵决策树,则整个模型在这个样本上给出的预测结果为:带人XGBoost最小化目标函数为:Obj(0)=E,L(y;-)+Zk,2(f.)其中,Obj()是目标函数线性空间上的表达,i是第i个样本,k是第k棵树,是第i个样本的预测值。ZL(y-)是损失函数二阶泰勒展开,Z,2()是正则项、控制模型复杂度。模型训练过程是对最小化目标函数的最优值进行参数权重w求解,即每个叶子节点的式子都达到最值点,整个目标函数也达到最优值。0.9110.9100.9090.9080.907调优后模型在准确率、精准率、F
17、1值、召回率、AUC值方面较初始模型均有较大程度提升(见表1)。模型评估:样本训练集上的表现展示了模型表1AUM01万元低资产客户盘活模型调优后模型效果提升情况默认值参数评价指标优化后测试集模型效果准确率0.931 4精准率0.895 1.F1值0.897 9召回率0.901 2AUC值0.9238邮政研究模型特征处理:将6 9 个指标作为自变量导入模型,对部分连续变量进行分箱并转化成独热编码。根据业务特点,将客户账龄分箱成1年以下、15 年、5 年以上三类;根据业务特征,将最近一次有登录手机银行、动账交易、快捷支付等行为距观察期时长分箱成3个月以内、36 个月、612 个月、13年、3年以上
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 数字化 邮政 金融 大众 客户 价值 提升 研究
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。