纵向多分类数据的广义估计方程分析.pdf
《纵向多分类数据的广义估计方程分析.pdf》由会员分享,可在线阅读,更多相关《纵向多分类数据的广义估计方程分析.pdf(7页珍藏版)》请在咨信网上搜索。
1、应用数学MATHEMATICA APPLICATA2024,37(1):251-257纵向多分类数据的广义估计方程分析尹长明,代文昊,尹露阳(广西大学数学与信息科学学院,广西 南宁 530004)摘要:广义估计方程(GEE)是分析纵向数据的常用方法.如果响应变量的维数是一,XIE和YANG(2003)及WANG(2011)分别研究了协变量维数是固定的和协变量维数趋于无穷时,GEE 估计的渐近性质.本文研究纵向多分类数据(multicategorical data)的GEE建模和GEE 估计的渐近性质.当数据的分类数大于二时,响应变量的维数大于一,所以推广了文献的相关结果.关键词:属性数据;纵向
2、数据;广义估计方程;高维协变量中图分类号:O212.1AMS(2010)主题分类:62F12;62J12文献标识码:A文章编号:1001-9847(2024)01-0251-071.引言设响应变量Y 是分成k类的属性数据(categorical data),协变量X是 p 1维向量.Y 属于第r类记为Y=r,其概率记为(r):=P(Y=r|X),r=1,k.显然,kr=1(r)=1,所以只需对(r),r=1,q(=k 1)进行建模.如果数据分成的k类没有大小顺序,比如分析人们出行对交通工具(可以是汽车,火车或飞机)选择得到的数据,可以用下面多项(multinomial)logit模型1:(r)
3、=exp(r0+XTr)/1+ql=1exp(l0+XTl),r=1,q,(1.1)其中r0,r分别是截距和回归参数向量,T表示向量或矩阵的转置.如果数据分成的k类有大小顺序,比如分析某种疾病的变化(分为变好,不变或变坏)得到的数据,可以用下面累积(cumulative)logit模型1:(r)=F(r+XT)F(r1+XT),(1.2)其中F(x)=exp(x)/(1+exp(x),是回归参数向量,=0 1 q q+1=是门限(threshold)值.有时,响应变量的取值分成t大类,不同大类之间的性质不一样,同一大类内的不同小类之间性质类似.这时建模可分两步(two step),第一步对大类
4、之间建一个模型,第二步分别对每一大类的不同小类之间建一个模型.例如Morawitz&Tutz2分析的商业调查数据,分为“知道”和“不知道”两大类;“知道”又分为“增加”和“减少”两小类.Fahrmeir&Tuts1分析的风湿疾病的数据分为“大有好转”,“好转”,“无变化”,“恶化”,“大有恶化”五小类,显然“大有好转”和“好转”是一大类,“无变化”是第二大类,“恶化”和“大有恶化”是第三大类(t=3).第一步对三大类建个模型,第二步对“大有好转”和“好转”建一个模型,对“恶化”和“大有恶化”再建一个模型.收稿日期:2023-02-05基金项目:国家自然科学基金(11061002);广西自然科学
5、基金(2015GXNSFAA139006)作者简介:尹长明,男,汉族,湖北人,博士,教授,研究方向:纵向数据.252应用数学2024不失一般性,第j大类数据记为Sj=sj1+1,sj,其中s0=0,st=k.第一步,对不同大类之间若用累积Logit模型建模,就得P(Y Sj|X)=F(j+XT)F(j1+XT),j=1,t,(1.3)其中=0 1 t1 t=.第二步,第j(j=1,t)大类若用多项logit模型建模,就得P(Y=r|Y Sj,X)=exp(r0+XTr)/1+sj1l=sj1+1exp(l0+XTl),r Sj,(1.4)其中参数(向量)sj,0=0,sj=0,如果si=sj1
6、+1,定义sj1l=sj1+1=0.由(1.3)式和(1.4)式决定的两步模型称为累积多项logit模型1.下面我们将累积多项logit模型写成广义线性模型的形式.记:=(1,t1,T),(10,T1,s11,0,Ts11),(st1+1,0,Tst1+1,st1,0,Tst1)T,ZT(X):=diag(Z0,Z1,Zt),其中diag(a1,a2,an)表示对角线元素为a1,a2,an,其余元素为0 的分块对角矩阵,Z0:=(It1,1 1 1t1 XT),Zj=Isjsj11(1,XT),j=1,t,Ia是a阶单位阵,1 1 1a是每个元素都是1的a 1向量,是Kronecker乘积,即
7、对矩阵A=(aij)和B,A B=(aijB).假设的维数是p=pn(可随样本容量的增加而增加),定义:=(1),(q)T:=ZT(X).则对r=1,k.当j=1,t 1,有(r)=F(j)F(j1)exp(tj+r)/(1+sj1l=sj1+1exp(tj+l),当sj sj1 2,sj1+1 r sj;F(j)F(j1)/(1+sj1l=sj1+1exp(tj+l),当sj sj1 2,r=sj;F(j)F(j1),当sj sj1=1,r=sj,(1.5)其中F(0)=0.当j=t时,有(r)=1 F(t1)exp(r)/(1+st1l=st1+1exp(l),当st st1 2,st1+
8、1 r st;1 F(t1)/(1+st1l=st1+1exp(l),当st st1 2,r=st;1 F(t1),当st st1=1,r=st.(1.6)对r=1,k=q+1,当Y=r时,定义y(r):=1,当Y=r时,定义y(r):=0.记y:=y(Y)=(y(1),y(q)T,():=E(y)=(1),(q)T,则显然y服从多项分布,q+1i=1(i)y(i),其中(q+1)=1 qi=1(i),y(q+1)=1 qi=1y(i).方差():=Var(y)=(1)(1 (1),(q)(1 (q)T,协方差矩阵():=Cov(y)=diag()()T().定义():=T/.当S1=1,2,
9、S2=3,即k=3,t=2,就得到Morawitz和Tutz2分析商业调查数据所用的两步Logit模型.这时P(Y=1)=P(y(1)=1)=(1)=1+exp(1)11+exp(2)1,P(Y=2)=P(y(2)=1)=(2)=1+exp(1)11+exp(2)1,P(Y=3)=1 P(Y=1)Y(Y=2),第 1 期尹长明等:纵向多分类数据的广义估计方程分析253其中(1),(2)T=ZT,ZT=diag(1,XT),(1,XT),T=(1,T,10,T1).当S1=1,2,S2=3,S3=4,5,即k=5,t=3,就得到文1中分析类风湿疾病数据所用的模型.这时P(Y=1)=P(y(1)=
10、1)=(1)=1+exp(1)11+exp(3)1,P(Y=2)=P(y(2)=1)=(2)=1+exp(1)11+exp(3)1,P(Y=3)=P(y(3)=1)=(3)=1+exp(2)1 1+exp(1)1,P(Y=4)=P(y(4)=1)=(4)=1+exp(2)11+exp(4)1,P(Y=5)=1 4i=1P(Y=i),其中(1),(2),(3),(4)T=ZT,ZT=diag(I2,1 1 12 XT),(1,XT),(1,XT),T=(1,2,T,10,T1,40,T4),1 0,an,bn Rpn,有supnn0pn/n,an=1,bn=1|aTnDn(n)Dn(n)bn|C
11、nRnRn,其中Dn(n)=TnSn(n),Dn(n)=TnSn(n),而Sn(n)=ni=1Zi i(n)A1/2i(n)R1nA1/2i(n)(Yi i(n).引理3.4若条件(C1)-(C4)成立,则supnn0pn/n,an=1,bn=1|aTnDn(n)Hn(n0)bn|=Op(npnZ2n).引理3.5若条件(C1)-(C5)成立,则对任意n=1,有nM1/2n(n0)Sn(n0)dN(0,1).引理3.6若条件(C1)-(C5)成立,则supnn0pn/nLnn(n)nLTn=op(n1),(3.1)其中Ln是满足LnLTn=Il的l pn阶矩阵,Il是l阶单位阵.定理2.1的证
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 纵向 分类 数据 广义 估计 方程 分析
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。