基于改进的K-means算法研究家庭环境对中学生认知能力的影响.docx
《基于改进的K-means算法研究家庭环境对中学生认知能力的影响.docx》由会员分享,可在线阅读,更多相关《基于改进的K-means算法研究家庭环境对中学生认知能力的影响.docx(10页珍藏版)》请在咨信网上搜索。
1、 基于改进的Kmeans算法研究家庭环境对中学生认知能力的影响 谭彩娟赖承栋苗晴摘要:从研究家庭综合环境与认知能力的关系的问题出发,针对中国教育追踪调查的九年级学生数据和家长数据,根据衡量家庭综合环境的八个因素即亲密度、情感表达、矛盾性、期望性、知识性、娱乐性、控制性和家庭经济状况,基于改进的k-means聚类算法,将调查对象聚类为四类家庭综合环境。研究发现:民主型家庭氛围配合劳逸结合的教育方式和正统性家庭氛围结合理性的教育方式,这两种家庭综合环境与中学生的认知能力呈正相关关系;冲突型家庭环境搭配专制型教育方式和放任型家庭氛围结合放养型教育方式,这两类家庭综合环境与中学生的认知能力呈负相关关系
2、。关键词:k-means聚类;家庭综合环境;认知能力:TP311 :A :1009-3044(2017)33-0178-031 概述认知能力是指人脑加工、储存和提取信息的能力,具体表现为文字表达能力,抽象思维能力、和空间识别能力等。关于影响认知能力的因素,国内外都有相关的研究。2014年7月8日,英国牛津大学克里斯斯潘瑟与他的研究团队一项遗传学研究显示,在阅读能力和數学能力上的差异,更可能是由学习环境造成的,而不是他们的基因。2015年王仁曾、刘畅探讨了性别、年龄、民族、父母等“先天因素”和受教育状况、职业经历、经济条件等“后天因素”都会影响中国人的认知能力1。本文从研究家庭综合环境与认知能力
3、的关系的问题出发,考虑亲密度、情感表达、矛盾性、期望性、知识性、娱乐性、控制性和家庭经济状况八个衡量家庭综合环境的因素,采用中国教育最终调查提供的全面、专业、高质量的九年级调查数据,运用改进的k-means聚类算法,探索家庭综合环境与认知能力之间的关系。2 数据收集及研究因素本文的样本数据来源于中国教育追踪调查(CEPS)的调查数据2,该调查根据2010年全国第六次人口普查数据,将全国(31个省、自治区、直辖市,不含港澳台)共2870个有常住人口的县(区)级行政单位中,共抽取28个县(区),其中包括上海3个县和拥有大量流动人口的10个县,其余15个县在全国各县中随机抽取。在每个选中的县(区)中
4、抽取4所学校,在每所被选中的学校中分别取4个班级,包括2个七年级班和2个九年级班。本文的样本数据采用中国教育追踪调查(CEPS)的七年级数据,剔除七年级无效调查问卷后(部分题目未作答),共有6124份有效调查数据。中国教育追踪调查(CEPS)同时采用3个维度、11个构念,衡量学生的综合认知能力。第1个维度为语言题题,包含词组类比和语言文字推理,第2个维度为图形题,包括图形规律分析、折纸类题目和集合图形应用,第3个维度为计算与逻辑题,包含数学应用、自定义运算规则、数列应用、抽象规律分析、概率和数值大小逆向思维。其中,测试内容不涉及学校课程所教授的具体识记性知识,而是测量学生的逻辑思维与问题解决能
5、力,并且具有国际可比性、全国标准化的特点。另外,采用三参数的IRT模型(用来分析调查问卷的数学模型)估计出学生认知能力测试标准化总分。我国学者综合中国实际情况将Moss等人于1981年研制的家庭环境量表进行了三次修订3,得出了符合中国文化的家庭环境因素,具有较好的信度和效度。本文的研究参考修订版的家庭环境量表,将亲密度、情感表达、矛盾性、期望性、知识性、娱乐性、控制性和家庭经济状况作为衡量家庭综合环境的因素。另外,中国教育追踪调查(CEPS)以问卷调查为主要手段,对全体被调查学生及其家长或监护人、班主任老师、主课任课老师以及学校负责人进行问卷调查。问卷的内容包括:学生的基本信息、户籍与流动、成
6、长经历、身心健康、亲子互动、家庭教育环境、家庭教育投入、对孩子的教育期望等。本文从中国教育追踪调查的家长问卷和学生问卷中,选用符合八个家庭环境因素的问题进行分析研究。3 K-means聚类算法K-means聚类算法的基本思想是依据实际情况选取适当的聚类个数K和随机初始聚类簇的中心。按照最邻近簇心原则把原始样本点赋给各个簇,同时求出每类中所有样本点与所在类质心的距离均值,并将求出的均值作为该类的新质心。然后按平均法重新计算各个簇的质心并一直迭代,直到各个簇的质心的移动距离收敛,最终确定各个簇的质心。K-means聚类算法操作步骤简单,易于操作,但存在以下缺陷:1) K-means的K值是个不确定
7、因素,需要凭借先验规律或根据实际情况选取。2) 初始的K个聚类簇的质心点是随机选取的,给定不同的初始质心点,就有不同的聚类结果。初始质心是随机选取的,所以会导致局部最优的情况,传统的K-means算法无法判断聚类结果是否达到整体最优的聚类效果。4 改进的K-means聚类算法本文基于k-means聚类算法对6124份有效原始数据进行分析,将家庭环境相似性大的聚为一类。当数据聚类后再研究不同聚类下中学生认知能力与家庭环境因素间的关系。针对K-means聚类算法K值不容易选取和随机初始质心点会造成局部最优的缺陷,本文采用轮廓系数和组内平方误差和(SSE)的方法对传统的K-means算法进行改进,解
8、决K值的选取和聚类效果局部最优的问题。4.1 整体轮廓系数算法轮廓系数结合了聚类的凝聚度和分离度,用于评估聚类的效果。轮廓系数取值范围为-1,1,通过整体轮廓系数可判断聚类效果,具体方法如下:1) 聚类凝聚度a(i):每个样本点i与其同一簇内所有其他样本点欧式距离的均值;2) 聚类分离度b(i):选取样本点i外的一个簇b,计算i与b内所有样本点间的两两距离的平均值,遍历其他簇,K个平均值中的最小值即为聚类分离度;3) 样本点轮廓系数s(i):s(i)=b(i)-a(i)maxa(i),b(i); 4) 整体轮廓系数s:i=1ns(i)ns=i=1ns(i)n。整体轮廓系数量化数据聚类的紧密程度
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 改进 means 算法 研究 家庭 环境 中学生 认知 能力 影响
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【w****g】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【w****g】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。