2023人工智能与数据要素竞赛白皮书.pdf
《2023人工智能与数据要素竞赛白皮书.pdf》由会员分享,可在线阅读,更多相关《2023人工智能与数据要素竞赛白皮书.pdf(67页珍藏版)》请在咨信网上搜索。
洞察竞赛趋势,激发数据力量人工智能与数据要素竞赛白皮书 2023White Paper of AI&Data Element Competition 2023AI&DATA ELEMENT COMPETITION人工智能与数据要素竞赛白皮书2023DATA SCIENCE洞察竞赛趋势,激发数据力量Follow the Tendency of CompetitionUnleash the Power within DataWhite Paperof AI&Data Element Competition 2023-编委会成员-(以姓氏笔划为序)付 莉龙 雨仇 玲徐浩程李俊杰张 洋龙 鸿刘晓霞刘明熹刘邵星刘洋琳刘心田刘铠华李 旭李 喆张琳艳杜宇建张敏文赵珺怡周 涛钱 岭郭 悦袁绍灵涂 平黄 炜梁加琦黄 毅游丽金魏晓锋何子易3.赛事架构3.1.1 赛事方案CONTENTS目录071.1 人工智能与数据要素竞赛概述1.2 人工智能与数据要素竞赛基本价值091.2.1 公共数据要素价值挖掘与应用探索091.2.2 赋能企业人工智能与数据要素人才储备1.2.3 完善企业生态建设090912142.1 主办方142.1.1 政府152.1.2 企业2.1.3 科研机构&高校2.2.1 算法赛人工智能与数据要素竞赛白皮书2023White Paper of AI&Data Element Competition 20231.2.4 跨学科融合交流与高校人才培养102.赛事主体1.竞赛基本价值及相关政策2.2 赛事类型2.2.2 应用赛2.2.3 技能赛2.2.4 教学赛061112133.1 赛事方案设计3.1.2 传播方案141617181919214.2023发展趋势与前景展望262224262627303334343532CONTENTS4.1 竞赛发展现状4.1.1 数据要素与数据产业化导向人工智能与数据要素竞赛白皮书2023White Paper of AI&Data Element Competition 20233.1.3 技术方案3.2 技术部署3.2.1 平台部署3.2.2 定制化开发3.3 赛事运营3.3.1 赛事招募3.3.2 选手运营3.3.3 专家运营3.3.4 社区运营3.3.5 活动运营3.4 赛事结果呈现3.4.1 赛事手册3.4.2 新闻报道3.4.3 会议/论坛发表3.4.4 项目孵化4.1.2 赛题统计与分析4.1.3 赛事主体统计与分析4.1.4 赛事类型发展趋势212226273031314041435.2023赛事案例44454545464343CONTENTS人工智能与数据要素竞赛白皮书2023White Paper of AI&Data Element Competition 20234.2 竞赛发展掣肘因素4.2.1 赛事类型创新瓶颈4.2.2 人工智能人才培养产教脱节4.2.3 宏观经济制约赛事资源投入4.2.4 参赛选手招募与转化难题4.2.5 优秀项目孵化及落地难题4.3 未来发展趋势4.3.1 赛题趋势展望:赛题领域多元拓展与垂直挖掘并行4.3.2 赛事服务发展趋势:延伸成果转化与赛事沉淀服务4.3.3 政策导向与支持力度促进竞赛市场回暖4.3.4 赛事出海:赛事国际化步伐加快5.1 政府赛事案例5.2 企业赛事案例5.3 科研机构&高校赛事案例6.参考文献4446464748525860人工智能与数据要素竞赛白皮书2023White Paper of AI&Data Element Competition 202301AI&DATA ELEMENT COMPETITION人工智能与数据要素竞赛基本价值及相关政策Value&Relevant Policy ofAI&Data Element Competition在数字化浪潮的推动下,人工智能(Artificial Intelligence,AI)正成为推动社会进步的关键力量,2023 年,全球 AI 产业迎来了历史性的转折点,生成式 AI 技术成为新的希望。中国 AI 产业规模在这一年达到了 2137 亿元,预计到 2028 年将增长至 8110 亿元,五年复合增长率达到 30.6%。随着 AI 技术的不断进步,我们见证了其在多个领域的广泛应用。从医疗健康到金融服务,从智慧城市到自动驾驶,AI 正以其独特的方式改变着世界。人工智能(Artificial Intelligence,AI)作为一门研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的新一代信息技术,已经从早期的符号主义、连接主义演变为如今的深度学习、神经网络、强化学习等多种范式的融合。现代人工智能涵盖了机器学习、自然语言处理、计算机视觉、智能决策等多个子领域,不仅在理论上取得了诸多突破,而且在工业制造、医疗健康、金融服务、无人驾驶等众多行业中产生了深远影响。近年来,人工智能已从单一技术的追求发展为与实体经济深度融合的智能技术集群,正在全球范围内引发新一轮科技革命和产业变革。2023 人工智能与数据要素竞赛白皮书 07人工智能与数据要素竞赛白皮书20231.1 人工智能与数据要素竞赛概述图1-1 人工智能发展简史数据要素(Data Element)是指在信息化时代,构成信息资源的基本单元,是信息社会中生产、流通和消费活动中必不可少的新型生产要素。随着大数据技术的飞速发展,数据要素的地位日益凸显,从最初作为业务运营的副产品,到如今成为驱动数字经济发展的核心资源。数据要素涵盖了原始数据、处理后的有价值信息以及用于支撑人工智能算法的训练数据等多种形态。随着数据确权、数据流通、数据安全等相关法规的完善,数据要素的开发利用也经历了从无序到有序、从封闭到开放的历史进程。人工智能与数据要素竞赛是以人工智能技术为基础,以数据为核心资源的创新性竞赛活动。这类竞赛旨在通过解决实际问题,推动人工智能技术在处理和利用数据要素方面的创新应用。2023 人工智能与数据要素竞赛白皮书 08人工智能与数据要素竞赛白皮书2023近年来,此类竞赛的内涵和形式都在不断拓展和深化,不仅涵盖了算法设计、模型训练、数据分析等技术挑战,还包含了数据处理、数据治理、数据安全以及数据伦理等多个层面。竞赛题目越来越贴近实际业务场景,鼓励参赛者从数据获取、加工、分析到最终形成可行解决方案的全过程参与。随着数据要素重要性的提升,人工智能与数据要素竞赛逐渐形成了产学研深度合作的新模式,主办方囊括了政府、企业、高校和科研机构等多个主体,共同推动人工智能技术与数据要素的融合发展。赛事中,参赛者不仅能够通过竞赛提升自身的数据处理和人工智能技术应用能力,还可以通过与企业合作,将创新成果转化为现实生产力,为推动数字经济的高质量发展贡献力量。同时,随着数据跨境流动、数据隐私保护等议题的日益紧迫,竞赛活动也越来越注重在合规前提下,探索数据要素的合理利用和有效保护,以此促进人工智能与数据科学领域的健康、可持续发展。2023 年 10 月 25 日,国家数据局正式挂牌成立。国家数据局的成立恰逢其时,意义深远。这将进一步加快全国统一、辐射全球的数据大市场的建设,推动数字经济加速发展。国家数据局统筹发展和安全,充分发挥数据的基础资源作用和创新引擎作用,不断做强做优做大数字经济,促进数字经济和实体经济深度融合,为构建新发展格局、建设现代化经济体系、构筑国家竞争新优势提供有力支撑。人工智能与数据要素竞赛是在全球数字化转型和数据经济蓬勃发展的背景下,一种新兴的、旨在激发创新活力、培养高端人才、挖掘数据价值的新型竞赛模式。此类竞赛以其独特的优势和特点,已经成为推动人工智能技术进步和数据科学应用的关键驱动力。人工智能与数据要素竞赛通常以公开或定向的数据集为基础,邀请全球范围内的学者、研究人员、开发者以及学生等数字人才参与,围绕数据处理、机器学习、深度学习、自然语言处理、图像识别、数据挖掘等核心领域展开角逐。通过竞赛,参赛者在限定时间内完成算法设计、模型构建、数据分析等工作,以解决实际或模拟的复杂问题,展示其在人工智能和数据科学技术上的先进性和应用性。人工智能与数据要素竞赛形式多样,既有线上云端环境下的算法比拼,也有线下实体空间里的技术展示与竞技。赛题设计紧跟技术前沿与行业热点,既可以是技术挑战赛,如算法优化、模型训练;也可以是场景应用赛,如智慧城市、智能制造、金融科技等领域的数据应用创新。此外,部分竞赛还配备了完善的评估体系,包括自动化的代码评审和数据结果评测,以及专家评审团的人工评定,确保了竞赛的公平性和权威性。通过竞赛,能够快速集中和培养一批具有实战经验的高素质人才,通过高强度、实战性的竞赛过程,锻炼参赛者的跨学科综合能力。2023 人工智能与数据要素竞赛白皮书 09人工智能与数据要素竞赛白皮书2023推动人工智能技术的创新应用,特别是对于数据要素的挖掘和利用,通过优化数据处理流程、提高数据分析效率,加速数据向生产力的转化。同时,竞赛集合了政府、企业、学术机构的力量,构建起产学研用一体的创新生态链,实现数据资源的高效配置与利用,推动了人工智能产业的蓬勃发展。充分发挥了数据作为新型生产要素的作用,通过合法合规的数据开放与共享,探索公共数据要素在社会治理、经济发展、民生服务等多领域的价值实现。1.2 人工智能与数据要素竞赛基本价值1.2.1 公共数据要素价值挖掘与应用探索2023 年 9 月,中国信息通信研究院发布数据要素白皮书(2023 年)。白皮书在数据要素白皮书(2022 年)的基础上,进一步探讨数据要素理论认识,聚焦过去一年来数据要素探索过程中不断涌现的新模式、新业态、新热点,重点关注资源、主体、市场、技术四大方面的发展,期望能为社会各界进一步参与数据要素实践探索提供有价值的参考。政府拥有海量人口、城市、税收、工业等社会关键数据,担负着激发社会公共数据要素潜在价值、引导社会经济良性发展、提升人民生活水平的重要责任。创新公共数据要素流通方式,激活数据要素潜能,探索公共数据要素应用方式是政府部门数字化建设工作的重要内容。1.2.2 赋能企业人工智能与数据要素人才储备在数字化转型的大潮中,企业对数据算法人才的渴求达到了前所未有的高度。人工智能与数据要素竞赛成为了企业快速聚集和识别此类人才的高效途径。此类竞赛不仅能够吸引大量对人工智能和大数据技术充满热情的专业人士参与,而且通过实战型的赛题设计,直观展现了参赛者的技术实力、创新思维和问题解决能力。企业据此甄别并吸纳优秀人才,不仅能够直接充实其技术团队,提升研发能力,更能优化人才梯队结构,为企业的长期发展奠定坚实的人才基础。通过竞赛机制,企业能够高效筛选出与企业文化相契合、技术能力出众的候选人,实现人才储备的战略布局,为未来的技术创新和业务拓展预留关键资源。1.2.3 完善企业生态建设在数字化转型的推动下,企业生态建设成为科技型企业增强市场竞争力的关键。通过举办人工智能与数据要素竞赛,企业不仅能够对外展示其先进且强大的产品功能,还能够借由赛事的影响力强化品牌效应,有效推动产品的市场推广与销售。2023 人工智能与数据要素竞赛白皮书 10人工智能与数据要素竞赛白皮书2023竞赛作为一种开放性平台,吸引着广泛的开发者、研究人员和企业用户的参与,这不仅扩大了企业用户基础,更为企业生态的社区建设提供了丰富的源头活水。参与者在竞赛中交流分享的经验、技术成果和创意,为企业生态注入了源源不断的创新内容,促进了服务与产品的迭代优化。这种正向循环进一步增强了企业生态的吸引力和粘性,构建了更加开放、活跃的开发者社区,为科技型企业带来了更强的市场竞争力和持续增长动力。1.2.4 跨学科融合交流与高校人才培养利用数据科学技术进行量化研究、大样本研究是目前学术界的主流研究方法之一,人工智能与数据要素竞赛能够有效促进数据科学人才与其他学科的融合交流。高校作为人才储量最大的单位,具备先天办赛优势。相对于政府、企业而言,高校办赛成本低,依靠天然人才池,可以获得较高办赛性价比。对于高校而言,数据科学成为未来的主流研究领域是大势所趋,而数据科学不能只停留在课堂上,必须通过实战进行学习训练,人工智能与数据要素竞赛为高校提供了一个良好的实训机会,让高校数据科学学科建设更加系统化,更加完整,同时可以提升学生数据科学应用能力,促进高校人才培养。人工智能与数据要素竞赛白皮书2023White Paper of AI&Data Element Competition 2023人工智能与数据要素竞赛赛事主体Event Composition of AI&Data Element Competition02AI&DATA ELEMENT COMPETITION2023 人工智能与数据要素竞赛白皮书 12人工智能与数据要素竞赛白皮书2023人工智能与数据要素竞赛作为一种数据要素应用形式,能够衍生出诸多价值路径,为数据要素所有者提供包括经济收益、人才选拔、政务开展等诸多价值。基于主办方的价值诉求与身份定位,人工智能与数据要素竞赛的主办方可以分为三大类:政府、企业与科研机构及高校。在 2022 年统计到的 288 道赛题中,企业办赛占据主流,共计 144道,占比 50%;科研机构&高校赛题数量多于政府办赛,共计 98 道,占比34.03%;政府办赛 46 道,占比 15.97%。政府、企业和科研机构及高校这三方各有特色,它们分别从政策引导、市场驱动和技术研发的角度出发,共同构筑了人工智能与数据要素竞赛的立体架构,有力地推动了这一领域的全面发展和繁荣。通过相互间的紧密合作与良性互动,人工智能与数据要素竞赛正成为激发创新活力、培养高端人才、推动科技进步和产业升级的强大引擎。2.1 主办方图2-1 2023竞赛主办方类型占比2.1.1 政府政府作为重要的倡导者与监管者,不仅制定了相关政策以鼓励和规范人工智能与数据要素领域的健康发展,还通过教育部门、科技部门、信息化部门等联合发起此类竞赛,以推动国家战略新兴产业的发展,培育高端创新人才,落实数据要素市场化改革。图2-2 政府办赛链路图数据要素信息收集数据拥有者数据分析&应用开发价值激活社保数据医疗数据违章数据公共监控人民政府行政部门成熟企业创业团队个人开发者智慧政务智慧金融智能制造智慧城市举办赛事成果转化2023 人工智能与数据要素竞赛白皮书 13人工智能与数据要素竞赛白皮书2023政府在人工智能与数据要素竞赛中的角色至关重要,它是赛事的宏观调控者和重要推手。政府通过出台相关政策法规,为人工智能和数据要素领域的发展提供制度保障,营造有利于科技创新的良好环境。具体到赛事层面,政府机构如科技部、教育部门、工信部门等会联手主办或协办此类竞赛,以国家战略为导向,设定符合国家科技发展规划和产业政策的竞赛主题。政府主办的赛事通常具有极高的权威性和公信力,不仅能够调动各方资源,保证赛事的顺利进行,还可以吸引来自全球的顶尖团队和个人参与。赛事的举办有助于推动国家人工智能与数据要素相关技术的发展,发掘并储备高端人才,同时也能引导和规范行业健康有序发展,促进产学研用的深度结合,加速科技成果的转化与应用。图2-3 典型政府赛事 山东省第五届数据应用创新创业大赛2.1.2 企业企业作为市场竞争的主体和技术创新的主力军,积极参与到人工智能与数据要素竞赛的主办工作中,凭借其深厚的行业经验和市场敏感度,基于自身的业务需求和技术积累,洞察市场趋势,主动发起和主办赛事,以解决实际应用场景中的痛点问题。企业主办的赛事通常更加注重技术创新的实用性与商业化潜力,旨在挖掘能够直接服务于产业升级、产品优化或市场拓展的解决方案。企业通过竞赛,不仅可以吸引和筛选出具备优秀技术和应用能力的团队或个人,为其提供实际项目实践的机会,还能借此契机与参赛者建立起长期合作关系,共同推动产品和服务的迭代更新。同时,企业主办的赛事还有助于塑造品牌形象,展示企业的社会责任感和技术领导力,进一步巩固和提升其在行业内的地位。2023 人工智能与数据要素竞赛白皮书 14人工智能与数据要素竞赛白皮书2023图2-4 典型企业赛事 中国移动“梧桐杯”大数据应用创新大赛科研机构与高校在人工智能与数据要素竞赛中承担着创新源和人才培养基地的重任。它们主办的赛事往往以基础理论研究和前瞻性技术探索为主,旨在引导参赛者攻克学术难题,推动学科边界拓展和技术创新。科研机构通过主办竞赛,可以促进学术界的交流合作,碰撞出新的研究火花,孕育出具有颠覆性意义的创新成果。高校作为人才培养的主要场所,通过主办或参与此类竞赛,可以提升在校学生和青年教师的实践能力,锻炼其解决复杂问题的技巧,同时也能激发学术好奇心和科研热情,为人工智能与数据要素领域输送源源不断的高质量人才。2.1.3 科研机构&高校图2-5 典型科研机构赛事 猛犸杯国际生命科学数据创新大赛2.2 赛事类型算法赛是指以算法技术为核心,针对具体问题设计具有客观可量化评分标准的赛题,通过算法搭建与大量数据分析解决具体问题的数据科学竞赛形式。2.2.1 算法赛2023 人工智能与数据要素竞赛白皮书 15人工智能与数据要素竞赛白皮书2023图2-6 第三届“梧桐杯”三大算法赛赛道算法赛面对不同办赛主体产生了多种价值。在政府办赛中,算法赛开放大量公共服务数据,创新政府数据开放方式,让地方公共数据惠及社会。在企业与科研机构办赛中,算法赛能够筛选技术人才与算法方案,一方面解决人才精准招聘与技术交流的问题,另一方面发现优秀算法,提升业务算法水平、完善业务算法体系,促进学术算法发展。18%17%14%13%11%9%8%6%4%2.2.2 应用赛应用赛是指以实际需求为核心,探索算法框架与实际需求的创新性结合方式,同时综合商业模式、市场需求等因素的数据科学竞赛形式。应用赛主要通过方案落地发挥价值,尤其政府办赛提供的创业扶持、资本对接、宣传推广能够促进优秀项目加速孵化。赛事过程中提供的专业培训指导也能够推进参赛方案的二次优化,增强落地可能性,为民生福祉与经济发展做出贡献。图2-7 第二届移动云杯大赛应用赛赛道2023 人工智能与数据要素竞赛白皮书 16人工智能与数据要素竞赛白皮书2023专为企业、工会以及其他组织内部员工量身定制,旨在提升员工在当今数字化转型浪潮下的核心竞争力,尤其是针对数据科学与人工智能关键技术领域,通过丰富的实战演练与严谨的考核机制,全面检验并提升参赛者的职业技能水平。赛题可覆盖一系列重要技术板块,包括但不限于数据处理、机器学习、深度学习、自然语言处理(NLP)、图像处理、数据挖掘以及大数据技术等。针对不同的技能层级,可设计不同的实操训练课程与考核内容,确保每位参赛者无论处于何种技术水平,都能找到适合自己的挑战,从而在实践中不断提升专业能力。考核形式上采用灵活且多元化的试题结构,主办方可根据实际需求自由配置各类题型,如单选题、多选题、判断题以及填空题等。这种高度定制化的试卷设计能够更好地适应不同岗位与角色的技能评测需求。评分机制方面采取自动化与人工相结合的方式,确保公正客观的同时,兼顾了主观题目的评估灵活性。单选题和判断题基于标准答案进行自动评分,大大提高了批阅效率;对于多选题,可根据各个选项的重要性进行精细化赋分,鼓励参赛者全面理解问题;填空题则引入了关键词匹配自动评分功能,同时保留了人工复核和评分的环节,确保对参赛者答案的深度和准确性进行全面考量。2.2.3 技能赛图2-8 DC技能赛答题页2023 人工智能与数据要素竞赛白皮书 17人工智能与数据要素竞赛白皮书20232.2.4 教学赛教学赛是近年来教育与职业技能培养领域的一种革新尝试,特别是在人工智能教育方面,通过创新的教学赛形式,实现了教育方式的融通与升级,构建了一个多元化、融合型的学习生态环境。首先,教学赛作为一种新型教学手段,打破了传统的课堂讲授模式,由高校教师发起,以课程作业或者项目任务的方式呈现给学生。这种竞赛化的学习方式,鼓励学生将所学人工智能理论知识应用于实际问题的解决中,通过机器自动评分与代码审查双重考核机制,确保了对学生实践操作能力和理论知识掌握程度的精确评估,从而开辟了一条全新的教学成果考核路径。在教学赛的设计上,强调了实训场景的竞技新模式,努力打通高校教育与社会实践的壁垒。通过精心策划的比赛场景,力求使教学训练环节尽可能接近真实的业务情境,让学生在富有竞技性和趣味性的实战环境中磨练技能,深度体验从理论到实践的过程,有效激发他们的学习积极性和创新潜能。总之,教学赛是对传统教育模式的一种有益补充和深化,它能够有效地将教学内容与实际需求相结合,培养学生们的自主探究能力和创新能力,为我国人工智能教育事业的长远发展奠定了坚实的基础。图2-10 DC竞赛平台哈尔滨工业大学(深圳)教学赛图2-9 DC教学赛人工智能与数据要素竞赛白皮书2023White Paper of AI&Data Element Competition 2023人工智能与数据要素竞赛赛事架构The Framework of AI&Data Element Competition03AI&DATA ELEMENT COMPETITION2023 人工智能与数据要素竞赛白皮书 19人工智能与数据要素竞赛白皮书2023人工智能与数据要素竞赛的赛事方案设计主要指比赛的背景和机制设计,确定赛事基调,指导赛事落地,包括组织架构、赛事类型、赛程赛制、概念包装、赛事奖项等内容。3.1 赛事方案设计3.1.1 赛事方案 组织架构人工智能与数据要素竞赛的组织架构通常分为三个层级:指导单位、主办单位、协办单位。指导单位在政府背景赛事中出现较多,主要为主办单位的上级主管部门,级别较高的指导单位能够提升赛事级别与社会影响力。主办单位主要为竞赛组织的实际决策单位,也是竞赛的实际发起单位。协办单位包括竞赛的运营单位、赞助单位以及其他相关单位。赛事类型目前常见的人工智能与数据要素竞赛主要分为算法赛与应用赛两类。算法赛是以算法技术为核心,针对具体问题设计具有客观可量化评分标准的赛题,通过算法搭建与大量数据分析解决具体问题的人工智能与数据要素竞赛形式。应用赛是指以实际需求为核心,探索算法框架与实际需求的创新性结合方式,同时综合商业模式、市场需求等因素的人工智能与数据要素竞赛形式。算法赛以数据分析技术为核心,采用机器客观评分的考核方式,注重参赛者个人技术实力的较量,有助于实现技术人才选拔。同时,算法赛需要大量数据作为支撑,是促进公共数据开放与应用的有效途径。应用赛以创新应用方案为核心,采用专家主观评分的考核方式,综合考量参赛方案在专利技术、市场需求、商业模式等多维度的价值,有助于选拔优质创业团队与解决方案。同时,应用赛对主办方提供的数据量要求较低,赛事筹备的技术难度较低。同时,由于大数据技术与人工智能的深度绑定,目前也出现了许多以仿真、机器人为形式的人工智能与数据要素竞赛。2023 人工智能与数据要素竞赛白皮书 20人工智能与数据要素竞赛白皮书2023图3-1 应用赛与算法赛特征对比 赛程赛制人工智能与数据要素竞赛大多为开放竞赛,面向社会大众或特定范围征集参赛者,如专门面向在校学生、在职人士、特定领域从业者等,这类赛事以初赛-决赛的二轮赛制为基础,通过初赛过滤不符合技术要求的参赛者,通过决赛进行最终排名。在两轮赛制的基础上衍生出了初赛-复赛-决赛的三轮赛制,利用复赛对初赛晋级的选手进行更精准的筛选。与开放式竞赛相对的是定向邀请赛,由主办方邀请参赛团队,这类赛事赛制较为自由,参赛团队较少,可以采用多轮赛制,也可以采用一轮赛制。竞赛赛程视赛制而定,在多轮赛制中初赛时间最长,通常占赛事全程的一半;复赛时间较短,供参赛者进行参赛方案优化;决赛时间与复赛时间类似,供参赛者进行方案的进一步优化。一般来说,人工智能与数据要素竞赛的总体赛程在 3 个月左右。赛事奖项人工智能与数据要素竞赛的主要奖励机制包括奖金、获奖证明、政策扶持三方面。作为人工智能与数据要素竞赛最为直观、直接的激励机制,奖金数量与分配是影响参赛者竞赛选择的重要因素,奖金与招募效果存在正相关关系。随着近年来单场赛事规模扩大、赛题数量增加,赛事总奖金水涨船高,2023 年部分赛事奖金总额超过百万元。获奖证明是在校学生群体较重视的赛事奖项,含金量较高的赛事获奖证明能够为其就业提供便利。政策扶持包括政府类赛事中的项目孵化政策、人才引进政策与企业赛事中的就业支持政策。政府赛事主办方为获奖团队提供场地支持、政策支持与资本对接,为获奖人员提供落户、就业便利;企业赛事主办方为优秀选手提供面试直通车或入职邀请。优厚的政策扶持能够弥补奖金缺口,提升赛事吸引力与社会评价。2023 人工智能与数据要素竞赛白皮书 21人工智能与数据要素竞赛白皮书2023赛事传播是人工智能与数据要素竞赛运营过程中的重要环节,一方面良好的赛事传播够吸引更多参赛者,从而提升赛事水平;另一方面精准的赛事传播能够有效扩大赛事的社会影响力,助力办赛方的品牌建设。在面向社会大众的一般赛事中,传播方案主要包含两方面的内容:赛事招募信息传播与赛事成果传播。赛事招募信息传播是赛事整体传播方案中最重要的部分,合理配置赛事传播渠道、设计赛事传播内容是实现良好赛事招募效果的前提。目前较为常见的赛事招募信息传播方式包括自媒体广告投放、社群传播、垂类平台广告投放等。赛事成果传播是主办方品牌传播与成果展示的重要途径,能够向社会公众与领域内人士传递品牌价值。常见的赛事成果传播方式主要以新闻媒体传播与垂类自媒体传播为主。3.1.2 传播方案图3-2 DC竞赛赛事传播方案概览3.1.3 技术方案人工智能与数据要素竞赛以线上赛为主,专业的技术支持是赛事筹备的必要条件。从赛事运行的角度,赛事技术方案可以分为竞赛环境搭建方案、赛题与评分算法设计方案两大类。竞赛环境搭建方案人工智能与数据要素竞赛需要线上赛事运行环境,主要表现为赛事网站以及相应的竞赛系统。其中竞赛系统又分为作品提交系统、主客观评分系统、赛事排行系统、在线编程系统、算力设施等。2023 人工智能与数据要素竞赛白皮书 22人工智能与数据要素竞赛白皮书2023办赛过程中必然需要赛事网站、竞赛系统、在线算力与服务器。在算法赛中,参赛者需要将作品上传赛事网站或依靠赛事网站系统提供的在线编程功能进行方案开发,在赛事后台进行评分,并将评分反馈给参赛者。这一整个过程都需要有功能完善的赛事平台与足以匹配赛事需要的云计算资源。2010 年 Kaggle 竞赛平台在墨尔本成立,标志着人工智能与数据要素竞赛商业化的成功,以 Kaggle 平台为代表的 Kaggle 竞赛模块也成为了竞赛平台的标准技术架构,主要包括参赛系统、在线实训系统与评分系统三大部分。参赛系统为参赛者提供报名、组队、作品提交等基本功能,主流竞赛平台也包括评论分享、社区交流等功能。办赛过程中,赛题是最为关键的一环,直接关系到办赛需求的满足、赛事招募能力与赛事整体效果。赛题设计、数据准备与评分算法的制定构成了核心三要素,直接影响赛事的成功与否。对于政府机构而言,赛题设计不仅要聚焦于数据的开放共享与实际问题的解决,还需考虑如何吸引广泛参与者,这就要求赛题既要具备一定的挑战性,也要确保数据的可获取性和代表性,以激发不同背景选手的兴趣与参与度。政府赛事应注重数据集的构建,确保其质量、多样性和隐私保护,同时提供详尽的数据说明文档,帮助参赛者快速理解数据结构与背景,提高赛题的吸引力和可操作性。对于企业而言,赛题设计需紧密结合业务痛点,旨在挖掘具有解决实际问题能力的人才,因此赛题难度和数据的针对性至关重要。企业应精心挑选或合成与业务场景密切相关的数据集,确保数据的时效性与真实性,同时考虑数据的脱敏处理,以保护敏感信息。在此基础上,同样需要经验丰富、技术水平较高的算法专家进行赛题优化,以及跟随赛事进程,不断关注赛事进行的最新反馈,确保赛题既能准确反映业务需求,又能合理评估参赛者的技能水平。此外,评分算法的设计应综合考虑解决方案的创新性、实用性及技术难度,以期全面评估参赛作品的价值。在整个赛事进程中,数据的动态更新与反馈机制同样重要。赛事主办方根据赛事进展适时调整数据集,引入更多样化的真实场景数据,以增强赛题的现实意义。同时,通过算法专家的持续指导,优化评分算法,确保其公正性与准确性,及时反映参赛作品的最新进展与创新点,为赛事的公正评价与人才选拔提供可靠依据。赛题、数据与评分算法设计方案3.2 技术部署3.2.1 平台部署2023 人工智能与数据要素竞赛白皮书 23人工智能与数据要素竞赛白皮书2023在线实训系统是目前参赛算法开发的主流方式,支持参赛者在竞赛平台的网站直接进行代码开发与算法运行,一方面降低了不同参赛者所拥有的算力资源对赛事结果的影响,提升比赛结果的公平性;另一方面可以通过云端环境保障赛事数据的安全性,避免敏感数据外泄。评分系统能够将赛题测试集数据导入选手提交的算法模型,并自动计算模型准确性与运行效率等赛题评分的关键指标,为参赛算法打分并生成实时排行,根据评分规则全自动客观评分维护赛事结果公正。在赛事部署策略中,公有云因其灵活性和成本效益成为普遍选择,尤其适合需要快速扩展资源的比赛,尽管这要求依赖云服务商来确保数据安全。私有云部署,则为数据安全和合规性要求极高的竞赛提供了全面控制,适合处理敏感信息,尽管初期投入较大。混合云策略巧妙融合两者,利用公有云处理高计算需求,同时在私有云保护敏感数据,实现了灵活性与安全性的平衡。而对于处理极高度机密数据或在特定限制环境下的竞赛,断网或离线部署成为必要,通过物理隔离确保数据安全无虞,尽管这可能牺牲一定的便捷性和扩展性。因此,根据赛事的具体需求、数据敏感度、成本考量及安全要求,科学选择公有云、私有云、混合云或断网部署模式,是确保竞赛顺利举办与数据安全的核心策略。近两年,云计算逐渐成为人工智能与数据要素竞赛的主流技术应用。为赛事赛题匹配相应的云计算资源是举办人工智能与数据要素竞赛优先考虑的问题之一,其要求包括适当的性价比、稳定性、算力匹配等。适当、稳定的云计算资源可以提升参赛体验、降低赛事运营难度、避免各类问题,良好的性价比可以降低赛事成本,实现资金合理化分配,并提升主办单位复办意愿。另外,成熟的赛事系统能够有效维护赛事数据安全。随着数据在企业运营中的重要性逐渐增加,数据安全逐渐成为办赛过程中主办方最为关心的问题之一,如何在保障数据内容完整传递到参赛者手中完成竞赛的同时,避免敏感数据外泄,成为人工智能与数据要素竞赛技术筹备阶段最为重要的问题。赛事数据需要在脱敏后应用于赛事运行,对于保密级别更高的数据,脱敏处理不足以满足保密性需求,数据传输过程同样需要采用完善的加密手段与平台设计,使数据保留在线上,而不会被参赛者非法下载转作他用。根据具体赛题需求和数据敏感度的不同,部署了数据科学协同平台与计算资源的云端竞赛环境可以选择将赛题数据挂载在工具内,禁止参赛者将数据下载至本地,防范数据泄露的风险。2023 人工智能与数据要素竞赛白皮书 24人工智能与数据要素竞赛白皮书2023同时控制竞赛平台用户访问权限,防止未授权用户非法使用系统,以身份识别、登录次数限制、账号验证、口令验证等方式严控用户数据访问权限、界定访问范围。图3-3 竞赛数据传输方式对比在数据传输过程中采用 TLS 安全协议实现系统间数据传输的完整性保护,防止传输数据被嗅探和窃听。在服务器之间传输数据、用户终端访问应用系统之间都支持通过支持安全传输协议与传输信息的加密实现传输安全。在数据储存中对数据库中的结构化业务敏感信息采用高强度数据库口令保护,减少数据库口令被破解的风险;对存放在数据库中的敏感信息采取非对称加密,保证非法用户即使进入数据库也无法获取有用信息。将非结构化数据如文本、音频、视频通过加密后存放在文件系统,即使非法用户获取到文件也不能直接读取文件的内容。3.2.2 定制化开发赛事主办机构和办赛目标的多样化导致不同赛事的差异逐渐扩大,以 Kaggle 模式为基础的标准人工智能与数据要素竞赛模块(主要包括参赛系统、在线实训系统与在线评分系统)已经不足以满足复杂化的赛事需求,因此定制化开发几乎成为国内绝大部分赛事的硬性需求。传统竞赛传输方式云端竞赛传输方式参赛者报名云端竞赛采用云端创建项目的方式下载数据集至本地调用训练集数据本地操作,数据集内容完全暴露算法模型搭建调用测试集数据返回测试结果优化模型上传结果,获取成绩参赛者报名获取项目权限创建项目云端查阅训练集数据算法模型搭建提交模型至评分服务器服务器运行模型返回测试结果优化模型提交模型,获取成绩云端操作除训练集数据外完全不可见取代本地创建项目,避免数据下载操作2023 人工智能与数据要素竞赛白皮书 25人工智能与数据要素竞赛白皮书2023定制化开发主要包括两方面:前端展示开发与后端功能点开发,在视觉展示、交互体验、功能特色、赛事流程等方面形成各自的赛事特色,以满足不同主办方的办赛需求。前端展示开发前端展示开发指赛事网站页面视觉效果和交互设计的开发,如网站落地页设计、交互按钮设计、详情页入口设计等,需要网页 UI 设计与前端开发的配合,是形成独特赛事品牌的基础环节。图3-4 赛事落地页示例 后端功能点开发后端功能点开发包括与前端展示的内容对应的功能点以及特殊的赛事系统功能,如特殊的数据加密方式、数据传输方式、评分方式、在线答题、代码评估等传统赛事模块之外的特殊功能。在赛事基本需求不变的情况下,赛事后端功能点可以复用,以缩减赛事平台部署成本,对于新的赛事品牌而言,由于缺乏赛事平台搭建经验,往往需要依托于成熟的赛事平台进行定制化开发,因此定制化的后端功能点开发是新赛事的必要环节。2023 人工智能与数据要素竞赛白皮书 26人工智能与数据要素竞赛白皮书2023人工智能与数据要素竞赛的流畅运行需要稳定合理的赛事系统与高效精准的赛事运营相结合,近年来人工智能与数据要素竞赛的形式逐渐复杂化,附属赛事活动越发多样化,使数据科学赛事从数据与选手的链接转变为主办方、数据、选手、专家、活动相关方等多方参与的有机整体,这些特征为赛事运营带来了更大的挑战。3.3 赛事运营3.3.1 赛事招募除极少数与参赛者有天然强关联的主办方(如高校)外,大多主办方与潜在参赛者具有距离。成熟的招募手段是办赛效果与赛事完成度达成的关键,利用适当的运营手段增强赛事粘性,引导参赛者走完从报名到完赛的全流程,提高完赛/报名比。同时合理的招募方式也是控制赛事成本的重要手段,筛选优质高效招募渠道,提升招募成本投入产出比,并维系参赛者忠诚度,提升系列赛事复参率。另外,在赛事进行过程中,往往会出现各种各样意想不到的问题,轻则引发部分选手的不满、重则导致赛事停摆、大批选手退赛,因此办赛还需要专人进行赛事运营(非计算机技术手段),这对于赛事顺利进行、赛事目标高效达成以及打造口碑良好的赛事品牌具有重要作用。3.3.2 选手运营选手运营是赛事运营的主要环节,由于赛事形式逐渐复杂,选手在参加竞赛的过程中经常遇到赛事规则不明确、赛题要求不清晰、赛事系统故障、赛题数据不完整等问题,这些问题一方面阻碍了赛事的正常运行,需要专人负责收集选手的反馈信息,并交由相关技术人员进行修改更正;另一方面可能引发参赛者不满情绪,阻碍赛事正常进行甚至引发负面舆论,对主办方社会形象造成不利影响,需要运营人员及时进行公关安抚,降低负面舆论声浪,维护赛事良好声望。3.3.3 专家运营在近年来的赛事实践中,客观评分与专家主观评审相结合是绝大多数赛事决赛的主要形式,尤其在应用赛中,专业水平高、行业声望大的专家评审是维护赛事结果公平合理的重要因素。因此,专家评审的邀请与接待也是人工智能与数据要素竞赛运营的重要工作之一。2023 人工智能与数据要素竞赛白皮书 27人工智能与数据要素竞赛白皮书20233.3.4 社区运营人工智能竞赛具有天然的社区效应,越来越多数据科学人才选择参赛以实践理论技能,并在过程中进行持续的协作、交流和讨论,形成了具有专业属性的社区雏形。以全球最大的人工智能竞赛平台 Kaggle 为例,作为全球最大的数据科学人才社区,在与不同机构组织合作举办人工智能竞赛之外,Kaggle 还以数据集、开源代码项目分享等丰富的内容吸引人才汇集,在其数据科学的成长发展之路上不断进行助力和赋能,从而使得海量处于不同成长阶段的专业人才均对其产生了强大- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2023 人工智能 数据 要素 竞赛 白皮书
咨信网温馨提示:
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【宇***】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【宇***】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【宇***】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【宇***】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。
关于本文