基于用户画像的学生学习质量评价方法研究.pdf
《基于用户画像的学生学习质量评价方法研究.pdf》由会员分享,可在线阅读,更多相关《基于用户画像的学生学习质量评价方法研究.pdf(6页珍藏版)》请在咨信网上搜索。
1、第44卷总第13 1期2023年9 月西北民族大学学报(自然科学版)Journal of Northwest Minzu University(Natural Science Edition)Vol.44,No.3Sep,2023基于用户画像的学生学习质量评价方法研究林强强,满正行,曹永春,刘彩虹(西北民族大学数学与计算机科学学院,甘肃兰州7 3 0 0 3 0)摘要针对学生学习质量持续跟踪并支持个性化评价问题,文章研究基于用户画像技术的评价方法.从技术角度出发,主要讨论了用户画像数据的采集、数据的处理、画像模型的构建等技术,在此基础上讨论了学生学习趋势的预测应用.综合利用多源异构数据,对学生
2、用户进行个性化建模,实现了数据驱动的学习质量评价,因此,本研究对提高学生学习质量具有一定的实用价值.关键词学习质量;综合评价;用户画像;专业认证中图分类号TP311文献标识码A文章编号10 0 9-2 10 2(2 0 2 3)0 3-0 0 2 5-0 60引言据教育部高教司2 0 2 1年6 月公布的数据显示1,截止2 0 2 0 年底,累计2 57 所高校的16 0 0 个专业已通过工程教育专业认证,其中计算机类专业涉及近16 0 所高校(含计算机科学与技术93 所、软件工程45所、网络工程9所、信息安全7 所、物联网工程6 所),专业认证已经成为高等教育质量保障体系的重要组成部分.工程
3、教育专业认证倡导“以学生为中心、以产出为导向、质量持续改进”的理念2 ,这也是国家一流专业申报的基本条件要求3.其中,质量持续改进理念要求建立质量监控和持续改进机制、持续跟踪改进效果,并通过持续改进不断提升专业人才的培养质量4。学生学习质量评价是质量持续改进的重要内容,要做到持续改进,首先要从制度层面建立教学质量闭环监控保障体系,并制定与之匹配的质量要求,其核心是要构建教育教学活动的全过程跟踪体系,以技术手段记录教育教学的全过程.以教育质量的持续改进为目标,从数据的角度研究不同教育用户的特征、变化及它们之间的关联,有助于构建客观的可追朔、可预测的质量监控系统5-6。用户画像(User Prof
4、iling)是近年来提出的虚拟用户模型构建技术7,试图通过用户的性格特征、兴趣偏好、行为习惯等信息构建具有明确含义、可表征和可预测用户行为的语义化标签,实现用户行为的多视角、多层次分析.用户画像在医学、心理学、情报科学、行为科学、网络舆情治理、广告营销和个性化服务等诸多领域得到了广泛关注并发挥着重要的作用8.由于用户画像技术在教育领域有着明确的需求和较强的可实施性,由此已催生了学生画像、教师画像、院系画像和学校画像等概念其及研究分支.高校信息化建设催生了各类业务系统,互联网孕育了“网络学堂”“智慧学堂”等新型教学模式.移动收稿日期2 0 2 3-0 4-12基金项目2 0 2 1年度国家民委高
5、等教育教学改革项目“数据驱动的学生质量评价改革研究”(2 10 2 4);2 0 2 1年度西北民族大学创新创业教育教学团队项目“编程提高与竞赛算法教学团队”(2 0 2 1XJCXCYTD-01);2 0 2 1年度教育部产学合作协同育人项目“面向学习质量持续改进的学生画像研究”(2 0 2 10 2 3 8 3 0 17)2 0 19 年度甘肃省创新创业试点改革专业项目“计算机科学与技术”(10 0 11510 0 6)作者简介林强,男,教授,博士,博士生导师,主要从事机器学习、图像智能计算研究.25计算、无线感知等技术的广泛应用,使得高校产生了海量、多样、动态、复杂的教育数据.这些数据有
6、些源自教学活动,有些源自教育管理,涉及学生、教师、管理人员,具有跨院系、跨学校等不同层级.从学生教育体系的“需求侧”出发,以教育教学质量的持续改进为目标,基于多源异构教育数据,综合运用统计分析、机器学习和人工智能等技术构建“学生画像”,多层次、多视角分析学生的学习质量,预测发展变化,识别状态异常,进而为教师和管理者等教育的“供给侧”改革提供依据,这也成为新工科时代教育教学质量管理的有效途径之一。本文基于用户画像的学生学习质量评价方法,从技术角度讨论学生画像数据的采集、数据的处理和画像建模等内容.1学生画像的技术框架学生画像的目标在于构建高等教育教学质量持续改进的技术支撑,核心在于学生画像的数据
7、采集、处理和模型构建,为学生学习质量的评价和发展趋势提供更好预测.图1为学生画像的基本技术框架,涉及画像数据采集、数据处理、画像建模及画像应用四个方面.画像应用学习质量评价学习趋势预测画像建模事实标签模型标签预测标签数据处理CLEANSING数据清洗数据集成数据规约数据转换数据采集教学活动数据图1学生画像的技术框架学生画像数据采集阶段应用网络技术、富媒体技术和感知技术,收集不同来源的教育数据,包括教学活动数据和教学管理数据,例如教学过程数据、学习行为数据和教学结果数据等.数据处理阶段应用数据清洗、数据集成、数据归约和数据转换等技术,对多源、异构、跨模态数据做格式规范处理,为画像建模提供有效的数
8、据.画像建模阶段应用统计分析技术、建模分析技术和预测分析技术构建学生用户事实标签、模型标签和预测标签,同时生成学生个体和群体的用户画像.画像应用阶段用流数据挖掘和分析技术,针对学生个体和群体画像,可靠评价学生学习质量、探究学生学习变化趋势,最终生成可支撑持续改进的决策建议。2学生画像的关键技术2.1数据采集技术学生画像数据类型丰富,主要有各类感知数据、网络使用数据、内部业务系统数据和跨模态富媒体数据,这些数据有些是内部数据,有些是外部数据.图2 给出了学生画像涉及的不同数据来源以及可行的采集技术.2.2业务系统数据的采集高校各业务系统是学生画像数据的来源主体,涉及学生综合管理系统、教务管理系统
9、、校园一卡通系统、图书馆系统、考勤系统和门禁系统.这些系统提供授权访问接口,数据结构相对简单,通常存储于关系型数据库.因此,只要拥有合法访问权限便可采集到相应的数据.但是,归属不同业务系统的相同数一26一教学管理数据据,可能有着不完全一致的格式,采用的数据结构也不完全一样.因此,当不同来源的学生数据接人学生画像系统时,需要在数据预处理阶段解决不同业务系统的对接和不同格式数据的整合问题.采集业务系统对接、物理-信息的融合挑战数据整合数据结构化数据模态关系型数据库数据教务管理系统来源学生管理系统一卡通系统考勤/门禁系统数据业务系统数据类别2.2.1营富媒体数据的采集富媒体技术用于获取图像、音频、视
10、频和网页链接等多种媒体学习数据,主要包括传统教学场景、网络教学场景和智慧教学场景.传统教学场景数据包含课堂教学实录,记录学生在学习过程中的状态、响应及交互等信息,可借助带有声音摄像头在传统教室或录播教室实现数据的获取.网络教学场景主要指校内局域网构建的学习/教学管理系统、基于互联网构建的远程教学系统和MOOC系统,以获取学生个人数据、成绩数据、课堂学习数据、教学过程记录,对这些数据的采集工作主要是访问接口的制定、数据格式的转换和统一化存储等.智慧教学场景数据包含智能设备的学习数据、社交网络的学习数据、VR/AR/MR的学习数据等,包含个人信息、情境感知数据、位置感知数据、学习行为数据和社交关系
11、数据等,这些数据的采集体现在数据的实时记录、统一结构存储和访问接口标准化等方面.非结构化的富媒体数据为教育数据的挖掘提供了数据保障,但对数据收集的可行性、数据的可用性和后期处理提出了更大挑战.2.2.2社交数据的采集高校的业务平台及互联网访问每天都会产生大量的日志信息,这些数据具有流式结构,如搜索引擎的浏览量和查询等,包含反映学习过程的行为数据和反映学习结果的考评结果等.如可以采用Cloudera提供的Flume系统,通过在日志系统中自定义多类别数据的发送器,对数据做简单处理,然后写入不同数据接收器(如文本文档、HDFS数据库等).学生社交数据的收集难度较大,其原因主要有两方面:一是师生双方在
12、教学过程中主动收集长程数据的意识尚未完全建立,使得数据的完整性和有用性受到影响;二是学校智慧数据平台部署情况差异较大,一定程度上影响了数据的全面性.为了收集全面完整且可用性强的学生用户画像数据,可建立从教师到学生、从管理到教学的纵向贯穿、横向覆盖的机制和平台保障,并逐步养成随时记录过程数据的主观意识.2.2.3?行为感知数据的采集感知技术用于获取学生在学习过程中产生的听觉、视觉和触觉等感知交互数据.从实现角度讲,可利用智能终端或可穿戴设备实时获取学生的语言、行为、面部情绪以及当前位置与运动轨迹,进而从多模态数据发现隐含的学生学习行为、兴趣和状态等信息.位置和轨迹信息反映了学生的学习行为,如经常
13、去图书馆或实践创新中心,就意味着学生具有积极的学习状态,这些状态与学习成绩等信息融合起来,可以全面了解学生的学习状态,并可进一步做成因分析.2.3数据处理技术画像数据的来源具有多样异构特征,因此难免存在数据值缺失、标准不统一、格式不一致或噪声干扰等问题.在构建学生画像之前需要进行预处理操作,这些预处理操作主要有数据的清理、数据的集成、数据的归约和转换等.2.3.1类数据清洗数据清洗是要完成不匹配属性或值的检测工作,并使用清理工具实现同步转换或处理.首先,需要对表达27一数据收集的可行性、可用性和后期处理的复杂性文字、图像、音频和视频传统教学场景网络教学场景智慧教学场景富媒体数据图2 学生画像的
14、数据来源及采集技术数据的完整性、有用性、全面性不足流式结构数据社交网络系统访问日志社交数据多维时间序列数据移动轨迹数字足速行为感知数据一同一信息的不同类型数据进行格式检查和转换,确保用同一类型表示同一数据,可采用数据迁移技术实现类型检测与转换;其次,当原始数据存在缺失值时,无法确保数据的真实有效性.当缺失值较少时可做简单删除处理,但若缺失值太多时可采取人工干预与机器学习相结合的方式做插补处理;再次,噪声是被测量变量的随机误差或方差,可以应用基本的数据统计描述技术(盒图或散点图)和数据可视化方法,识别可能代表噪声的离群点;最后,数据标准化的目的是将不同性质、不同量级的数据进行规范化,以调整到可以
15、类比的范围.例如在建立逻辑回归模型时,性别的取值是0 或1.但是成绩取值可能是0 10 0,跨度较大,需要进行标准化处理.一般可以采用最小/最大标准化(Min-Max标准化法)、Z分数法标准化将数值限定在0 到1之间.2.3.2数据集成数据集成完成多源、异构数据的逻辑或物理集中,为学生学习质量的分析和教育质量的评估提供全面统一的数据.目前,数据集成的主要方法包括联学习、基于中间件的建模分析和数据仓库.可运用实体识别和关联抽取技术,实现结构化数据中知识的获取,需要重点解决嵌套表、多列值、外键关联等复杂表数据的处理;可运用Wrapper技术从半结构化数据中获取知识,需要重点解决包的自动生成、更新、
16、维护及数据对齐,基于图映射的链接数据知识获取.包括深度学习在内的机器学习技术常用于实体及关系抽取,以实现基于历史数据的趋势预测.实体融合是数据集成的重要环节,它的目的在于消除多数据源间相同实体属性值的冲突问题,主要包括基于规则的无监督学习技术和使用标记数据的半监督学习等方法.比较而言,虽然半监督学习技术可获得较好的性能,即有着较高的识别准确度和召回率,但数据标注过程需要的人力和时间成本是影响数据集构建的主要障碍.因此,可通过运用主动学习技术收集训练数据以降低研究成本.2.3.3数据规约数据归约是指在尽可能保持数据原貌的前提下,最大限度地精简数据量,主要包括维度规约和数量规约.其中,维度规约以减
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 用户 画像 学生 学习 质量 评价 方法 研究
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。