基于文本挖掘的主观类型电子作业智能辅助评分方法研究.pdf
《基于文本挖掘的主观类型电子作业智能辅助评分方法研究.pdf》由会员分享,可在线阅读,更多相关《基于文本挖掘的主观类型电子作业智能辅助评分方法研究.pdf(5页珍藏版)》请在咨信网上搜索。
1、Microcomputer Applications Vol.39,No.10,2023文章编号:10 0 7-7 57 X(2 0 2 3)10-0 0 0 5-0 5基于文本挖掘的主观类型电子作业智能辅助评分方法研究基金项目微型电脑应用2 0 2 3年第39 卷第10 期张大为,王琦菲(辽宁师范大学,计算机与信息技术学院,辽宁,大连116 0 0 0)摘要:针对主观类型电子作业人工评阅方式存在的主观性强、准确率低和效率低等问题,提出一种主观类型作业智能辅助评价模型AutomaticScoringModel(ASM),具体包括相似度、主题贴合度、工作量和篇幅结构四项评价指标。采用文本挖掘技术
2、对作业进行量化处理,形成对不同类型作业组织都适用的评价指标。实验表明,ASM模型的评分结果更具有客观合理、准确高效等特点,可以作为主观类型电子作业的辅助评价方法,具有推广应用价值。关键词:ASM;文本挖掘;文本主观作业;自动评分中图分类号:TP311Research on Intelligent Assistant Evaluation Method for Subjective E-homework(College of Computer and Information Technology,Liaoning Normal University,Dalian 116000,China)Abs
3、tract:There are some problems in manual evaluation of subjective E-homework,such as strong subjectivity,low accuracyand low efficiency.This paper proposes an intelligent additive evaluation model for subjective homework automatic scoringmodel(ASM),which includes similarity index,theme index,workload
4、 index,figure index.Text mining technology is used toquantify the homework,which can organize applicable evaluation indexes for different types of homework.Compared with theresults of manual scoring,the results of ASM model scoring are more objective,reasonable,accurate and efficient.Therefore,it ca
5、n be used as an additive evaluation method for subjective E-homework,and has the value of popularization and application,Key words:ASM;text mining;subjective text homework;automatic scoring精力,势必会对教学和科研产生影响,故将评阅工作智能化、0引言自动化、便捷化是当前的趋势,也是巫待解决的问题之一4。提高教学质量是高等教育发展的核心任务,也是建设教随着人工智能的发展,自动评阅技术逐渐成为研究热育强国的基本要
6、求。为了提高教学质量,必须在教学环节点。文本挖掘技术是从诸多复杂的非结构化文本数据中获中正确认识课程作业的重要性。课程作业的布置和批改是取隐形、有用的数据信息,进而实现文本数据自动化处理的教学过程中的基本环节:一方面有助于学生巩固所学知识、技术5。利用文本挖掘技术处理文本数据的能力,设计实现了解阶段性学习效果、提高学业成绩、修正日后的学习规划;自动化文本作业评价方法,辅助教师给出客观合理的评价结另一方面还可以帮助教师了解教学成果、调整教学进度,是果是充分利用主观作业帮助提高教学质量的关键,具有重大改进教学和开展教学活动的重要依据2。由此可见,客观合研究意义。理的作业评价是提高教学质量的必要条件
7、。1相关工作主观类型作业在教育测量方面具有以下两个优点:一是有利于考察学生更深层次的能力;二是方便检验学生对课堂知识的综合掌握程度。但主观类型作业具有文档特征:一方面该类型作业开放性更强,写作排版风格统一困难,完成质量差距更大;另一方面易受评阅人知识水平、心理活动等主观因素影响,难以保证评分的客观准确性3。教师长时间高强度地评阅作业,很容易产生视觉和精神疲劳,进一步影响评价结果的准确性。教师为作业的评阅付出大量的时间和基金项目:国家自然科学基金课题资助(2 0 2 0 0 0 37、2 0 2 0 0 0 8 4);辽宁省科技厅博士科研启动基金计划项目资助(2 0 2 10 30 1)作者简介
8、:张大为(197 1一),男,本科,副教授,研究方向为软件工程、大数据挖掘;王琦菲(1996 一),女,硕士,研究方向为软件工程、自然语言处理。5文献标志码:ABased on Text MiningZHANG Dawei,WANG Qifei国外对主观题的自动评分研究早于国内,包括使用浅层文本分析方法的PEG作文评分系统L6;通过解析候选答案,设计并匹配对应评分模板,实现开放型自动批改系统AutoMark7等。受中文的复杂性和独特性等因素影响,现有的国外研究成果不能直接应用,且对于答案开放的主观题自动评分的研究较少。陈贤武等8 以语义为核心,建立多特征语句的相似度模型,设计一个面向主观题的自
9、动评阅系统。吴Microcomputer Applications Vol.39,No.10,2023芳颖9采用双向Bi-LSTM和 CNN-LSTM对文本进行建模得到两个向量,并对其进行相似度计算预测文本质量。上述评分方法效果较好,但大多为有标准答案的简答题或无参考答案的作文,且应用成本较高,无法运用于开放型主观作业的在线评阅。本文提出的ASM评分模型及其软件实现不需要提前预设答案或评分模板即可实现自动评阅,提高评阅效率和客观性。通过近10 年的实践表明,自动作业评价结果在教师和学生两个维度的满意程度均达到9 8%以上。2相关技术2.1文本预处理作业文本需要进行预处理,将其标准化和格式化,即
10、数据清洗10 1后,才能对各项评价指标评分。首先要对每份作业(以下简称样本)进行读取并分词处理,然后建立学科领域停用词库,过滤停用词,最后统计词频,生成“文档-词频”矩阵,记作D:D=Ldocml其中,D的每一行表示一个样本,即第i行表示第i个样本,记作doci。D 的每一列为特定词语的词频,例如doc;表示第i行的第i列,也就是指第i个样本的第i个词语的词频。m为样本的总数,n为所有样本词语集合的大小。2.2余弦相似度余弦相似度指的是在向量空间中通过计算两个向量之间夹角的余弦值来度量其相似程度11。本文使用余弦相似度计算两个样本之间的相似性,计算公式为2docx docitS(doc;,do
11、c,)=其中,doci和dock分别为样本doc,和样本doc,在“文档-词频”矩阵D中第k列对应的词频。当余弦相似度值越接近1时,两个向量之间的夹角越接近0,其相似度越大。2.3TextRank 主题词提取TextRank本质是一种基于词图模型的排序算法,具有较好的关键词提取效果,在一定程度下接近有监督方法的效率。TextRank算法将文本抽象为词图模型记作G=(E,V),其中V为节点集,即由候选关键词矩阵组成,E是利用共现窗口构建图中两节点之间的边,迭代计算每个顶点的权值,收敛时权值排名在前的点即为文本关键词12 1。每个顶点权值的计算公式为TR(u.)=(1-d)+d2其中,d为阻尼系数
12、,和;均为词语节点,ln(;)是指向词语节点U;的词语节点集合,Out(u,)是词语节点u指向的词语节点集合。基金项目3主观文本类型作业智能辅助评分模型主观文本类型作业智能辅助评分模型AutomaticSco-ring Model(ASM)的基本内容是构建核心评价指标,并给出不同作业的合理的评价方法,流程如图1所示。首先对所有作业进行预处理,得到词频矩阵。然后根据作业类型组织适用的评价指标,最后生成评分公式并计算成绩。第一分词停用词统计词频一预处理阶段相似度指标第二阶段第三阶段该模型的合理性前提是每份作业所具有的独立性。所谓作业独立性,就是我们在布置作业时要求的每份作业必须rdocildoci
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 文本 挖掘 主观 类型 电子 作业 智能 辅助 评分 方法 研究
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。