交互式大模型驱动的大数据技术实践课程教学探索.pdf
《交互式大模型驱动的大数据技术实践课程教学探索.pdf》由会员分享,可在线阅读,更多相关《交互式大模型驱动的大数据技术实践课程教学探索.pdf(5页珍藏版)》请在咨信网上搜索。
1、55计 算 机 教 育Computer Education第 11 期2023 年 11 月 10 日中图分类号:G642交互式大模型驱动的大数据技术实践课程教学探索杨尚东,陈蕾,陈兴国,陈志(南京邮电大学 计算机学院,江苏 南京 210023)摘 要:针对大数据技术实践课程中缺乏实际场景数据的现状,分析交互式大模型与大数据技术实践的关联性,提出在大数据技术实践课程中融合交互式大模型的教学框架和流程,以大数据技术实践课程为例介绍教学实践过程,最后说明教学实践结果。关键词:交互式大模型;数据科学与大数据专业;大数据技术实践课程;CDIO 教学模式0引 言新时代背景下,国家高度重视数据作为新型生产
2、要素的基础资源作用和创新引擎作用1。各高校先后开设数据科学与大数据专业,旨在培养具备数据处理、数据分析、数据挖掘等方面技能的专业人才,该专业涉及计算机科学、统计学等相关学科,对人才培养的要求不仅需要具备丰富的理论知识,还需要具备更强的实践能力。大数据技术实践是数据科学与大数据专业的核心实践课程,但是由于大数据技术实践涉及前继课程多、应用性要求高,学生难以对数据进行高效理解和处理。目前,高校从多方面对大数据技术实践课程进行改革,文献 2 从大数据实践课程体系方面,探索了适应数据科学人才培养新方案;文献 3 探讨了不同大数据平台建设对实践类课程教学改革的影响;文献 4 从 OBE 教学理念出发,取
3、得了良好的实践效果。上述课程改革忽略了实践对象“数据”作为核心要素对实践教学过程的影响。首先,获取足够的真实、多样、高质量的大规模数据不易,学校无法提供足够多的实际数据集供学生使用,且真实数据的获取可能涉及隐私、法律等方面的限制;其次,大规模数据通常包含噪声、缺失值、异常值等,需要进行清洗和预处理才能得到可用的数据集。上述挑战会导致学生在实践中缺乏兴趣,繁杂的清洗工作也会占据学生大量实践时间。仿真引擎在计算机专业课教学中扮演着重要的角色5-6,近年来,仿真引擎发展至以大数据和大算力驱动的交互式大模型7-9,学生利用 IO/API 接口与大模型进行交互,获得仿真数据、相关原理和执行过程。在大数据
4、技术实践教学中,针对大数据获取和预处理难的特点,引入交互式大模型,学生可以根据自己兴趣,选择不同的交互模式产生数据,明晰数据产生的机理,学习不同交互分布下产生的数据处理方法,从而提升实践教学效果。1交互式大模型与大数据技术实践大数据技术实践课程通过完成数据存储设计、数据分析处理、数据展示等,培养学生的大数据实践和应用能力。当前,大数据技术实践课程多以数据挖掘类项目为导向,对结构化数值与文本数据进行预处理、算法设计和应用。课程采用的数据为电影推荐、垃圾邮件分类、文本情感基金项目:国家自然科学基金项目“基于全局度量的非稳定环境强化学习探索方法研究”(62206133);第二批新工科研究与实践项目(
5、E-JSJRJ20201317)。第一作者简介:杨尚东,男,讲师,研究方向为机器学习与人工智能,。文章编号:1672-5913(2023)11-0055-05202356计 算 机 教 育Computer Education分析等公开数据集4。这些数据集通常为科研服务,时效性不佳,与现实场景不符且数据量不够大,导致无法激发学生深入理解大数据中科学问题的兴趣。此外,多届学生往往采用同样的数据集,也会使实践教学陷入时间维度瓶颈,阻碍教学质量持续提升。交互式大模型是一种软件系统,用于生成和模拟各种真实世界场景和过程,它通过计算机生成的数值、文本、图像、声音和其他感官输入来模拟现实,并允许用户在虚拟环
6、境中通过 IO 接口和软件 API 接口进行交互,可以让不同用户获得不同视角、不同分布下的多样性数据7-9。交互式大模型广泛应用于多个领域,包括游戏开发、虚拟现实、科学研究以及产品设计等。近年来,交互式大模型驱动的教学系统得到了广泛关注,将其引入大数据实践课程教学中,建立以数据为中心要素的教学系统,总体架构如图 1 所示,主要包括交互式大模型和大数据处理模块两部分,系统底层由 Hadoop、Spark 等大数据平台支撑,其中,交互式大模型接收不同学生的 IO/API 交互命令,通过数据引擎(由生成式机器学习模型驱动,如 ChatGPT7)和物理引擎(由复杂动力学模型驱动,如 MuJoCo9)模
7、拟真实场景数据,不同学生的交互数据将会保存在平台的不同区域。大数据处理模块将数据分析、数据处理、数据展示等任务分解为底层的分布式计算任务,然后通过 Hadoop、Spark 等平台进行处理。通过该系统,学生可以根据自己兴趣选择交互式大模型中的不同任务,利用计算机建模进行实验,模拟和分析数据,进而完成教学和实践内容。在大数据技术实践课程中引入交互式大模型教学系统,其优势主要体现在以下几点。(1)交互性。学生可以通过 IO/API 接口,自己选择感兴趣的仿真场景生成数据,按照自己的想法调试和控制场景,尝试生成不同分布的交互数据。在这个过程中,可以激发学生探索不同场景的兴趣,增加学习新知识的主观性和
8、能 动性。(2)多样性。交互式大模型为学生提供了广泛的实验场景和任务选择。这些场景涵盖了大数据多种应用场景。学生可以根据自己的兴趣和学习目标,选择最适合的场景进行实验,同时,也能避免跨届学生使用相同数据。(3)真实性。交互式大模型模拟了真实的大数据处理环境。学生能够在一个虚拟但高度真实的环境中操作数据,与真实场景一致。让学生能够更好地理解概念和技术,亲身体验数据处理过程中可能遇到的问题和挑战。(4)时空解耦性。传统的大数据实践课程中,学生通常需要下载大数据集,这会受限于网络速度、存储容量的限制。交互式大模型使学生能够在线即时生成数据,使学生能够摆脱时间和空间限制,集中精力进行数据分析与处理。2
9、交互式大模型驱动的大数据技术实践课程教学框架和流程目前已经有很多交互式大模型,如 OpenAI公司发布的用于与用户进行自然语言对话的大语言模型 ChatGPT7,阿里巴巴公司发布的用于模拟淘宝用户线上行为数据的虚拟淘宝引 擎8,DeepMind公司发布的用于模拟四足机器人、机械臂等实体行为数据的 MuJoCo 仿真引擎9 等。利用这些交互式大模型软件,可以为大数据技术实践课程的教学方法提供支撑。交互式大模型驱动的大数据技术实践课程教学以交互式大模大数据平台系统(Hadoop、Spark)学生集合学生1学生2学生n学生n交互数据IO/API交互数据引擎物理引擎 交互式大模型数据分析数据处理数据展
10、示大数据处理模块 图 1 交互式大模型驱动的教学系统大模型教学第 11 期57型与交互式数据为中心展开,其教学总体框架如图 2 所示。首先,根据大数据应用需求,确定大数据技术领域、实际问题场景中学生需要掌握的技能,形成教学目标;基于教学目标,教学团队合理安排每次理论教学的内容,确定大数据实践案例的知识点,包括大数据概念、数据收集、数据清洗、分布式计算、机器学习等;在教学过程中,教师通过演示交互式大模型,引导学生如何在交互式环境产生交互数据和应用大数据技术解决问题,学生在教师的指导下进入交互式大模型环境,实际操作和验证案例;在教学阶段结束时,通过学生的学习效果和反馈意见,对交互式大模型驱动的大数
11、据实践教学效果进行评价,根据评价结果对教学方案进行优化。基于教学总体框架,设计交互式大模型驱动的大数据技术实践课程教学流程如图 3 所示,根据 CDIO 实践教学理念10,开展交互式大数据实践项目的讲授理论、布置任务、构思框架、设计功能、实施模块和运作系统 6 个环节。首先,根据教学目标和要求,讲授课程任务背景和大数据实践课程中所需理论;其次,对于交互式大模型中的不同任务进行内容说明,让学生了解诸如自然语言对话、推荐系统、智能决策等任务需求,并让学生根据不同任务构建团队进行实践 任务。在构思框架中,学生在了解任务后,教师抛出问题“如何与交互式大模型交互?高效的并行化数据采集和处理分析的架构是什
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 交互式 模型 驱动 数据 技术 实践 课程 教学 探索
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。