分销赏收藏举报申诉 / 18

立即下载开通VIP

当前位置：首页 > 研究报告 > 其他 > 2024年中国大模型行研能力年中评测.pdf

2024年中国大模型行研能力年中评测.pdf

上传人：宇***

文档编号：4419519

上传时间：2024-09-20

格式：PDF

页数：18

大小：1.41MB

《2024年中国大模型行研能力年中评测.pdf》由会员分享，可在线阅读，更多相关《2024年中国大模型行研能力年中评测.pdf（18页珍藏版）》请在咨信网上搜索。

1、2024年中国大模型行研能力年中评测（摘要版）AI变革行业创新发展2024 Evaluation of China LLM in Industry Research Mid-Year Report人工智能系列研究评测|OPPORTUNITY GROWTH INVESTMENT INSIGHTS中国：人工智能系列行业研读|2023/400-072-5588大模型技术潮流兴起催生中国大模型百花齐放。沙利文与头豹研究院联手对16个大模型进行综合评估，以深入梳理中国大模型在行研领域的应用表现，为各界提供清晰深入的视角，以应对预训练大模型引发的人工智能浪潮自2022年底ChatGPT向公众发布以来，AI

2、技术从科技企业的闭门探索正式走向全人类的视野。经过一年多的发展，基于GPT起源的大模型技术已成为国家技术和产业的关键战略要素，受到国际高度重视。在此背景下，中国地区涌现了数百个预训练语言大模型，参与者涵盖了顶尖学术研究机构和互联网科技企业。为梳理中国大模型能力梯队与企业背景，沙利文头豹研究院于2023年12月首次对大模型行研能力进行了多维度综合评测。半年后，随着大模型能力持续迭代升级，市场竞争格局经历多轮洗牌，当下的大模型市场已焕然一新。不仅百度、阿里、腾讯等互联网大厂继续引领市场，诸如Moonshot、零一万物、百川智能等大模型创业企业也纷纷崭露头角，挑战传统大牌互联网厂商的地位。为反映当前

3、最真实的竞争态势，沙利文头豹研究院与2024年8月，基于最新的大模型能力，梳理并评估了市场上领先的多家大模型，深入分析它们的当前行研综合能力。大模型是自然语言处理领域中深度学习技术的高阶应用，其通过对海量文本数据的深度训练，能够全面吸纳并提炼出丰富的语言学知识与语义内涵。这类大模型通常拥有庞大的参数规模，动辄数亿乃至数十亿参数，从而具备了高度精准的自然语言理解与生成能力，几乎能够实现与人类的无障碍交流。其广泛的应用场景涵盖了机器翻译、智能问答、文本摘要等多个领域。从技术发展的视角来看，语言模型的演进路径具有重要的启示意义。最初，模型基于深度神经网络进行训练；随后，业界逐步引入了预训练与微调相结

4、合的模式以提升模型性能；而当前，最前沿的范式已转向预训练结合提示训练，这一转变标志着自然语言处理在模拟人类思维交流方面的又一重大突破。大模型能够显著增强研究报告的编写效率，通过采纳精细化的询问策略，分析师在研究过程中能够实现效率的最优化。此外，这一模型还能够提供全面的文本编辑支持，包括校正、查重、以及文风润色等功能，从而确保分析师提交的工作成果达到更高的质量标准大模型行研评测|2024/400-072-558812研究目的基于数字行研解决方案的研究和实践基础，头豹研究院联合沙利文凭借百人分析师团队匿名投票机制，筛选了16个大模型，进行了多维度的综合评估，旨在全面了解并系统梳理中国大模型参与者在

5、行研领域的应用表现。研究目标了解中国大模型在行研领域的应用价值探析中国大模型在行研领域的综合表现梳理中国大模型的参与者现状评估中国大模型行研领域的发展潜力本报告的关键问题参与者发展现状：中国大模型的参与者有哪些？在行研领域的发展现状如何？行研应用表现：中国大模型在行业研究领域的实际应用表现如何？报告撰写能力：中国大模型在撰写行业研究报告方面的表现能力如何？模型基础能力：中国大模型逻辑推理能力、类比迁移能力等基础能力表现如何？行业理解能力：目前中国大模型在不同行业下的理解能力以及表现如何？中国：人工智能系列大模型行研评测|2024/400-072-5588Chapter 1大模型行研能力评测背景

6、及方法中国：人工智能系列大模型行研评测|2024/400-072-5588中国：人工智能系列大模型行研评测|2024/08行业研究通过深入分析特定行业的定义行业研究通过深入分析特定行业的定义、竞争格局和市场规模等关键要素竞争格局和市场规模等关键要素，提供深刻的洞察和见解提供深刻的洞察和见解。其方法论涵盖了从宏观的产业层到微观的产品层其方法论涵盖了从宏观的产业层到微观的产品层的全面分析的全面分析，对企业战略规划对企业战略规划、政策制定以及金融决策具有重要影响政策制定以及金融决策具有重要影响中国大模型行研能力评测行研背景概述行研背景概述行业研究涵盖从宏观的产业层到微观的产品层，各层级决定着相应的研

7、究方法，研究方法论囊括外部宏观因素和内部微观细节的全面分析在行业研究中，产业层、行业层和产品层分别代表宏观经济的不同层次：产业层涵盖具有相似特征的行业群体，行业层侧重于特定行业的市场动态和企业状况，而产品层则深入探讨具体产品或服务的设计、功能及市场定位。研究方法论随着这些层次的宏观到微观差异而有所调整，宏观层面关注政策、经济、环境等因素，而微观层面则包括发展历程、产业链分析等更为细致的内容。来源：沙利文、头豹研究院行研范围宏观维度分析中观维度分析政策经济环境法律发展历程产业链分析发展特征市场规模竞争格局产业层行业层产品层千行百业研究路径价值体现企业规划政务服务金融决策教育培训新闻传媒政策分

8、析竞争格局发展历程行业特征泛娱乐房地产农林牧渔互联网金融医疗采矿教育旅游制造市场规模行业分类产业链分析行业定义零售行研价值链重要程度高重要程度低行业研究通过深入分析，为企业战略规划和决策提供关键洞察和支持行业研究是一项全面分析特定行业发展现状和市场动态的深入过程，涵盖行业定义、分类、竞争格局、市场容量等关键维度。分析师通过深入研究，提供深刻的洞察和有价值的观点，为企业战略规划、政策制定、金融投资决策以及教育培训等多个领域提供重要支持。400-072-5588中国：人工智能系列大模型行研评测|2024/08从基础数据收集到深度分析输出从基础数据收集到深度分析输出，传统行业研究流程面临工具更新滞后

9、传统行业研究流程面临工具更新滞后、团队知识传承困难团队知识传承困难、信息溯源复杂性以及研报质量控制等重大挑战信息溯源复杂性以及研报质量控制等重大挑战，这些这些问题共同制约了行业研究的产出效率和创新能力问题共同制约了行业研究的产出效率和创新能力，限制了其发展潜力限制了其发展潜力中国大模型行研能力评测传统行研发展痛点传统行研发展痛点传统行业研究面临工具滞后、知识传承困难、信息溯源复杂和质量控制难度高等挑战，严重制约其产出效率和创新能力传统行业研究的产出流程包括三个步骤：首先是基础调研，聚焦于一手和二手行业数据的收集；其次是数据加工，涉及整理逻辑、验证数据真实性，并对关键信息进行可视化处理；最后是产

10、出结果，确保全文逻辑一致、可视化清晰并且观点合理。在实际操作中，行业研究面临多个挑战：1）工具更新停滞，自互联网兴起以来，行研主要依赖网络检索和办公软件，近20年未见显著革新；2）团队知识难以复用，由于高人员流动性和新成员培养周期长，分析师的经验和知识传承困难；3）信息溯源和合规性考量复杂，在应对海量信息和时间成本压力下，信息来源和合规性难以全面保障；4）质量控制难度高，质控人员缺乏专业撰写技能，同时专业分析师缺乏时间进行广泛质控，导致质量监控极为困难。这些核心挑战共同影响着行研的产出效率和创新，阻碍行研进一步发展。来源：沙利文、头豹研究院二手数据统计局数据、文献、网页、垂直媒体、招股书、第三

11、方研报、专业数据库一手数据行业专家访谈、消费者调研（问卷，圆桌）、自行监测数据研究成果研究报告、演讲稿、招股书行业章节、视频.撰写行业定义、特征、分类、历史、政策、分析制图产业链、竞争格局建模行业规模与预测模型传统工具Excel行研发展痛点生产工具停滞PPT和Word仍是生产核心工具，20年来没有更新新的行研生产工具溯源难考证面对海量信息和时间成本，信息来源难以考证，信息合规无法全面保障团队知识难以复用行业人员流动性较大，新人成长周期较长，分析师掌握的经验和知识复用性差质量把控难度高质控人员缺乏专业撰写技能，而专业分析师则通常无暇进行广泛质控1234调研分析产出400-072-5588中国：人

12、工智能系列大模型行研评测|2024/08数字行研解决方案数字行研解决方案，结合标准化工具和先进的大模型技术结合标准化工具和先进的大模型技术，有效克服了传有效克服了传统行业研究的核心制约因素统行业研究的核心制约因素，显著提升研究的精度和效率显著提升研究的精度和效率，并引领行业研并引领行业研究进入一个效率更高和质量更优的新产出范式究进入一个效率更高和质量更优的新产出范式中国大模型行研能力评测数字行研革新数字行研革新（以头豹脑力擎为例）数字化行研解决方案通过标准化工具和大模型技术，解决了行业研究的核心难题，提高了研究质量和效率，为行业分析带来了高效、精准的新范式数字化行研解决方案为行业研究带来范式革

13、新。该系统通过引入一系列标准化工具，如精准的信息溯源系统和写作规范，极大降低了行业研究的门槛，提升了撰写效率，并简化了质量控制流程。此外，数字行研基于大模型的强大底层支持，为分析师提供AI辅助工具，包括专家访谈、智能检索、查重、校对和改写功能，有效减少信息检索的难度，提升文本的准确性和撰写效率，同时加速分析师的专业成长。数字行研解决方案不仅解决了传统行业研究中的关键痛点，如信息溯源困难、严峻的质控挑战、知识低复用率和工具更新滞后，还借助大模型技术推动行业研究质量和分析师成长速度，引领行业研究向更高效、精准的新范式转变。来源：沙利文、头豹研究院AIGC文本创作辅助分析师智能研报生成高效智能AI生

14、成AI改写AI续写AI检索AI审核头豹写作系统“脑力擎”协同创作词条体系化培训工具可信协同开源数字身份Web3.0AI赋能标准赋能头豹研报产出提质增效接入智能技术工具提效创作沉淀，数据资产化协同创作词条开源信息调研综合分析结果呈现数字行研全面赋能400-072-5588中国：人工智能系列大模型行研评测|2024/08大模型在数字行业研究中扮演核心角色大模型在数字行业研究中扮演核心角色，其功能特性极大提升了研究的效其功能特性极大提升了研究的效率和质量率和质量。本研究聚焦于挖掘中国大模型在行业研究中的实际应用和优势本研究聚焦于挖掘中国大模型在行业研究中的实际应用和优势，了解大模型当前的能力边界了解

15、大模型当前的能力边界，以推动行研领域的创新与变革以推动行研领域的创新与变革中国大模型行研能力评测大模型赋能行研大模型赋能行研大模型在数字行业研究中扮演核心角色，其功能特性极大提升了研究的效率和质量。本研究主要聚焦于中国大模型在行业研究中的实际应用和优势，知晓大模型的能力边界，旨在推动行研领域的创新与变革作为数字行研的关键支撑，大模型通过其创作、生成、改写和检索等核心功能，全方位推动行业研究向前发展。首先，大模型扮演第三方AI专家角色，协助分析师在研究初期进行框架搭建和内容创作，有效减轻案头工作负担。其次，通过与分析师的有效互动，大模型助力生成结构化内容和洞察，显著提高基础内容的产出效率。进一步

16、，它通过减少文本错误和重复内容，优化校对流程，提升产出质量。最后，大模型能够快速处理海量数据，提供实时信息检索，增强分析师在有限时间内获取全面信息的能力。鉴于此，深入了解中国大模型行业的发展态势和技术创新对引领数字行业研究新范式至关重要。本研究的目标是全面评价中国领先的大模型技术，深入分析其在行业研究领域的实际应用和优势，全面审视大模型对行业研究发展的影响，以促进数字行业研究的创新和变革。来源：沙利文、头豹研究院行研赋能大模型通过使用大模型的文字生成功能，结合恰当的提问问题，让大模型帮助产出结构化内容，提高研报的产出效率50%AI内容生成利用大模型的改写、续写和查重功能，可以显著减少错别字、病

17、句和重复内容，从而提升文本质量和可读性，同时减少分析师在文本检查上的时间投入，降低超过70%AI文字校对通过利用AI大模型进行行业专家访谈，分析师可以迅速掌握行业的核心信息和精确的定义、分类，从而将初期行业研究阶段的时间缩短30%AI专家访谈运用大模型的互联网检索访问功能，结合精准的提问策略，帮助分析师定位关键信息，从而提升资料搜索效率超60%AI资料检索400-072-5588中国：人工智能系列大模型行研评测|2024/08大模型在辅助行业研究中大模型在辅助行业研究中，通过通过“两个创新两个创新”和和“三个准确三个准确”有效赋能行业分有效赋能行业分析析。本次评测将通过报告撰写本次评测将通过报

18、告撰写、行业理解和基础能力三方面测试行业理解和基础能力三方面测试，全面评全面评估大模型表现估大模型表现，甄别出最能有效辅助分析师生成高质量内容的大模型甄别出最能有效辅助分析师生成高质量内容的大模型中国大模型行研能力评测大模型赋能行研大模型赋能行研来源：沙利文、头豹研究院场景特殊性考察大模型按要求产出研究报告的能力信息数据准确性在时间、事件数据等信息层面，大模型是否能够产出准确的信息辅助分析师产出优秀且高质量的研究内容报告01分析维度创造性大模型是否能够从创造性维度展开深度分析，例如，在产业链分析中，是否能够提供多维且丰富的分析视角。同时，在市场规模增长或竞争格局变化的模块中，能否生成丰富的分析

19、角度以有效支撑分析结论01提示词理解准确性分析师与大模型交互期间，是否能够高效准确的理解分析师的提示词内容，以提升研究效率和信息产出质量02观点研判创造性对于行业发展、痛点、壁垒等认知研判上，除大众普遍认同的趋势，大模型是否能够产出创造性的趋势观点，以带给辅助行业分析进行更多层面的亮点辅助行业认知准确性针对不同行业，大模型是否能准确识别其独特商业模式、发展特征及主要核心竞争者，并生成符合专业行业认知、内容扎实且准确的高质量研究报告0203研报撰写能力行业理解能力行研基础能力二创新三准确场景特殊性场景特殊性考察大模型对于不同行业的认知理解深度考察大模型在文本生成的基础能力表现大模型通过创造性和准

20、确性双重赋能，提升行业研究的广度和深度，助力生成高质量、洞见性的分析内容大模型在辅助行业研究中，通过“两个创新”和“三个准确”有效赋能行业分析。“两个创新”包括分析维度的创造性和观点研判的创造性，利用创造力为分析师提供更广泛的视角指引，支持生成具有独创性和深度洞见的研究内容。“三个准确”则涵盖信息数据的准确性、提示词理解的准确性以及细分行业认知的准确性，通过严谨且精准的内容产出，帮助分析师更全面地把握行业动态，从而准确研判行业整体发展趋势。本次评测将通过三个维度的能力测试：报告撰写能力、行业理解能力及行业研究基础能力，全面评估大模型在创新性和准确性方面的差异化表现，最终甄别出在行业研究中最能有

21、效辅助分析师生成高质量内容的大模型。400-072-5588中国：人工智能系列大模型行研评测|2024/0820232023年首次对大模型的行研能力进行评测后年首次对大模型的行研能力进行评测后，沙利文联合头豹研究院发布沙利文联合头豹研究院发布20242024年年中评测更新结果年年中评测更新结果，选取了中国市面上的选取了中国市面上的1616个领先大模型进行综合个领先大模型进行综合评估评估，以洞悉中国大模型在行研领域的最新应用进展以洞悉中国大模型在行研领域的最新应用进展中国大模型行研能力评测评测大模型参与者大模型行研能力评测参与者本次对大模型的行业研究能力评测的时间区间定于7月15日至8月2日，期

22、间调用各企业官网在此时间段内性能最佳的模型API。自ChatGPT推出后，生成式AI在全球范围内引发热潮，逐渐渗透到日常生活和工作场景中。2023年首次对大模型的行研能力进行评测后，沙利文联合头豹研究院发布了2024年年中评测更新结果，选取了中国市面上的16个领先大模型进行综合评估，以洞悉中国大模型在行研领域的最新应用。来源：沙利文、头豹研究院豆包参评大模型榜单400-072-5588中国：人工智能系列大模型行研评测|2024/08本次大模型行研能力测试覆盖了本次大模型行研能力测试覆盖了3,540道题目道题目，由由20位资深研究分析师和位资深研究分析师和10个中外裁判大模型共同参与评测个中外裁

23、判大模型共同参与评测。经过严格的双盲评测流程经过严格的双盲评测流程，综合评估综合评估了大模型在研究报告撰写了大模型在研究报告撰写、基础能力和行业综合理解方面的表现基础能力和行业综合理解方面的表现中国大模型行研能力评测评测方法与指标大模型行研能力评测方法论介绍本次评测覆盖模型三大行研能力板块，结合20人资深研究分析师团队与10个中外裁判大模型，经过严格的双盲评测流程得出，最大程度保证公允性本次大模型能力测试围绕三大核心板块展开评测：分别是行研报告撰写能力，模型基础能力以及行业理解能力。通过模型在三大核心板块的表现力最终得出评测结果。其中，报告撰写覆盖20篇不同行业报告撰写，涵盖300道问题，分析

24、师长期跟踪报告问题累积超3,000道题；模型能力覆盖6大文本产出核心能力，涵盖60道问题；行业理解覆盖15大核心行业，每个行业涉及12个问题，总计180题。三大维度合计3,540道题目。分析师团队均由头豹研究院各团队资深分析师组成，且均具备超过16个月的大模型使用经历。评测方法分为分析师人工评估和大模型裁判模型自动评估两种。在分析师评测端，采用双盲机制以最大程度保证公允性。每位测试人员会随机分配N个模型进行答案收集，期间禁止相互分享信息，以确保在答案评测阶段的公平性。在评测阶段，每个问题对应的16个模型答案顺序会被随机打乱，以防止评测人员对答案产生任何偏见。在裁判模型评测端，使用全球最领先的十

25、个中外大模型作为裁判模型进行打分。为消除模型偏见并提升评分公允性，每个裁判模型将生成三个评分版本并取其平均值。最终，通过这十个裁判大模型的平均评分来决定裁判模型打分的结果。来源：沙利文、头豹研究院A.报告撰写问题B.模型基础能力问题C.行业理解问题行业定义行业分类行业特征发展历程产业链分析市场规模政策分析竞争格局逻辑推理知识能力意图理解总结提炼角色扮演长文本生成金融业医疗业制造业互联网科技业零售业教育业运输业.16个中国主流大模型裁判模型与析师团队双重评测研究院全员长期跟踪400-072-5588中国：人工智能系列大模型行研评测|2024/08沙利文联合头豹企业研究所采用的沙利文联合头豹企业研

26、究所采用的8-D方法论方法论，由八个核心模块构成由八个核心模块构成，形形成了一个系统化成了一个系统化、全面性的行业深度分析框架全面性的行业深度分析框架。在这一框架下在这一框架下，百名分析百名分析师研磨提炼一套高效的师研磨提炼一套高效的8D模块提问方法模块提问方法，以对模型能力进行评测以对模型能力进行评测中国大模型行研能力评测报告撰写能力大模型报告撰写能力8-D方法论通过模块化提问框架，显著提升了行业研究的清晰度、数据严谨性和报告质量评估的有效性沙利文联合头豹企业研究所采用的8-D方法论，由八个核心模块构成，形成了一个系统化、全面性的行业深度分析框架。在这一方法论的支持下，详实的数据与精准的分析

27、相结合，提炼出富有洞察力的结论，大大提升了行业研究的清晰度和数据的严谨性。经过百余名分析师历时八个月的紧密协作与多轮优化，最终开发出一套高效的8-D模块化大模型提问框架。这一精心设计的提问体系已转化为评估工具，通过对十六个模型的定向提问，深入检验并评估模型报告的撰写质量和有效性。政策分析行业定义行业特征产业链分析竞争格局市场规模发展历程行业分类行业研究报告撰写逻辑权重占比10.0%10.0%10.0%10.0%15.0%15.0%15.0%15.0%对特定行业的基本性质概述，涵盖主要活动、服务或产品对影响特定行业的政府政策、法规和指导原则的评估从原材料采购到最终产品销售的整个流程进行完整分析审

28、视区分一个特定行业与其他行业的独特属性和条件，囊括多个维度根据某些共同特征将不同的行业进行分组的过程，理解行业结构描述行业从诞生到当前状态所经历的各个阶段和重要转折点在给定时间内的总销售额或总市场价值，反映经济影响力和潜力描述行业内各企业间的竞争状态，包括市场份额分布和竞争动态变化概述类模块分析类模块行业定义行业分类发展历程行业特征产业链分析政策分析市场规模竞争格局概念引入44明确主体理清边界观点输出归纳总结趋势研判八大维度分析法+来源：沙利文、头豹研究院400-072-5588中国：人工智能系列大模型行研评测|2024/08从从AI辅助行研报告撰写角度出发辅助行研报告撰写角度出发，结合分析师

29、长期使用大模型撰写经验结合分析师长期使用大模型撰写经验，归总出对于行业研究报告撰写角度最核心的六大能力维度归总出对于行业研究报告撰写角度最核心的六大能力维度，包括逻辑推理包括逻辑推理、总结提炼总结提炼、知识能力知识能力、角色扮演角色扮演、意图理解意图理解、以及长文本生成以及长文本生成中国大模型行研能力评测行研基础能力大模型行研基础能力从AI辅助行研报告撰写角度出发，结合分析师长期使用大模型撰写经验，归总出对于行业研究报告撰写角度最重要的六大基础能力维度逻辑推理：逻辑推理是指通过分析和推断数据和事实之间的逻辑关系，确保报告内容具有严谨的逻辑结构。大模型通过分析数据和推断逻辑关系，帮助分析师确保报

30、告结构严谨、结论可靠。总结提炼：总结提炼是指从大量信息中提炼出关键要点，并简洁明了地呈现重要结论和见解。大模型通过从大量信息中提炼关键要点，帮助分析师快速整理和归纳内容，使报告清晰有条理。知识储备：知识储备是指拥有广泛的行业和市场知识，结合多学科背景信息撰写深度分析报告。大模型凭借广泛的行业和准确的市场知识，帮助分析师撰写深度分析报告，提供前瞻性见解。长文本生成：长文本生成是指生成结构完整、内容详实的长篇分析报告，确保每一部分内容都有充分的论证和数据支持。它能够帮助行研报告保持一致性和连贯性，使内容读起来逻辑清晰、易于理解。意图理解：意图理解是指准确理解客户或读者的需求和意图，确保报告内容符合

31、其期望和关注点。它能够帮助行研报告灵活调整方向和重点，最大程度地满足不同读者的需求和阅读习惯。角色扮演：角色扮演是指通过模拟不同角色的视角，深入分析和预测市场行为和行业趋势。它能够帮助行研报告提供多维度的见解，满足特定读者群体的需求。来源：沙利文、头豹研究院总结提炼从大量信息中提取出关键要点和核心观点角色扮演在特定情境中模拟和扮演特定角色以实现特定目标长文本生成基于给定主题，撰写结构化和连贯的长字数内容逻辑推理通过分析和演绎现有信息，推导出合理结论知识能力掌握并准确应用广泛领域信息和概念的能力意图理解准确识别并理解模型使用者想要表达的目的模型基础能力模型基础能力400-072-5588中国：人

32、工智能系列大模型行研评测|2024/08头豹研究院成立至今汇集超头豹研究院成立至今汇集超7,000+行企报告行企报告，覆盖超覆盖超15个大类行业以及个大类行业以及上千个细分小类行业上千个细分小类行业。本次评测汇集各行业领域资深行业分析师本次评测汇集各行业领域资深行业分析师，结合自结合自身领域认知身领域认知，对模型在对模型在15大行业的理解和产出能力进行评估大行业的理解和产出能力进行评估中国大模型行研能力评测行业理解能力大模型行业理解能力头豹研究院成立至今汇集超7,000+行企报告，覆盖超15个大类行业以及上千个细分小类行业。本次评测汇集各行业领域资深行业分析师，结合自身领域认知，对模型在15大

33、行业的理解和产出能力进行评估沙利文联合头豹研究院成立至今，平台共积累超14万+注册用户，7,000+行业企业研究报告积累，覆盖15个大类行业，以及上千个细分小类行业。沙利文联合头豹的精英分析师团队以及各项研究成果广泛受到金融、制造、互联网科技等各个行业领域的用户认可。当前，头豹已发展成为中国最大的行企研究平台之一，拥有行业覆盖程度广、报告库数量多、报告撰写效率高、行业知识精准度高四大优势。在本次大模型行研能力评测中，头豹研究院联合上海、南京和深圳，汇聚了跨越多个行业专领域的资深分析师，利用自身对竞争格局、发展趋势、制约因素、以及行业壁垒等关键知识领域的深厚理解，并结合丰富的行业报告撰写经验，向

34、模型提出了针对15个主要行业的细致问题。通过对模型在各特定行业细分领域的纵向评估和全行业范围的横向比较，最终确定了16大模型在行业理解和内容产出方面的深度与能力。来源：沙利文、头豹研究院金融业医疗业制造业能源业运输业互联网科技电商零售业教育业商业服务业泛娱乐业房地产业农林牧渔采矿业旅游业行业理解能力证券/保险/基金云计算/大数据/人工智能住宅开发/商业地产/物业管理医院服务/医疗器械/生物技术超市/专卖店/电子商务农作物种植/畜牧业/水产养殖/林业汽车制造/消费品制造/工业设备K-12教育/高等教育/职业培训煤炭开采/金属矿开采石油与天然气/可再生能源管理咨询/人力资源咨询/IT咨询酒店/景点

35、/旅行社等货运物流/客运交通/航空运输/铁路运输电影/电视/音乐/电子竞技等电信业移动网络/卫星通信服务/宽带服务400-072-5588Chapter 2大模型行研能力评测结果中国：人工智能系列大模型行研评测|2024/400-072-5588中国：人工智能系列大模型行研评测|2024/08基于行研能力的三大评估维度基于行研能力的三大评估维度，对市场对市场1616个主流大模型进行评测个主流大模型进行评测。评测结评测结果显示果显示，商汤日日新商汤日日新、腾讯混元腾讯混元、通义千问通义千问、文心一言以及豆包位列第一文心一言以及豆包位列第一梯队梯队，模型综合表现强劲模型综合表现强劲中国大模型行研能

36、力评测结果报告完整版登录搜索2024年中国大模型行研能力年中评测400-072-5588中国：人工智能系列大模型行研评测|2024/08 头豹研究院布局中国市场，深入研究19大行业，持续跟踪532个垂直行业的市场变化，已沉淀超过100万行业研究价值数据元素，完成超过1万个独立的研究咨询项目。研究院依托中国活跃的经济环境，研究内容覆盖整个行业的发展周期，伴随着行业中企业的创立，发展，扩张，到企业走向上市及上市后的成熟期，研究院的各行业研究员探索和评估行业中多变的产业模式，企业的商业模式和运营模式，以专业的视野解读行业的沿革。研究院融合传统与新型的研究方法，采用自主研发的算法，结合行业交叉的大数据，以多元化的调研方法，挖掘定量数据背后的逻辑，分析定性内容背后的观点，客观和真实地阐述行业的现状，前瞻性地预测行业未来的发展趋势，在研究院的每一份研究报告中，完整地呈现行业的过去，现在和未来。研究院密切关注行业发展最新动向，报告内容及数据会随着行业发展、技术革新、竞争格局变化、政策法规颁布、市场调研深入，保持不断更新与优化。研究院秉承匠心研究，砥砺前行的宗旨，从战略的角度分析行业，从执行的层面阅读行业，为每一个行业的报告阅读者提供值得品鉴的研究报告。方法论400-072-5588

下载提示：咨信网仅提供存储空间/不修改/不编辑

【自信AI创作助手】【自信AI导航】
1、请仔细预览页面，基本判断完整性，对于直接下载带来的问题请及时与客服沟通；下载的文档，不会出现我们的网址水印。
2、该文档所得收入（下载+内容+预览）归上传者、原创作者；如果您是本文档原作者，请点此认领！既往收益都归您。

同意并开始全文预览

举报此文档有问题？有机会获“体验VIP”奖励！

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

25 金币 0人已下载

申诉本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请申请举报、认领或删除 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 2024 年中模型能力评测

咨信网温馨提示：
1、咨信平台为文档C2C交易模式，即用户上传的文档直接被用户下载，收益归上传人（含作者）所有；本站仅是提供信息存储空间和展示预览，仅对用户上传内容的表现方式做保护处理，对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿，我们不确定上传用户享有完全著作权，根据《信息网络传播权保护条例》，如果侵犯了您的版权、权益或隐私，请联系我们，核实后会尽快下架及时删除，并可随时和客服了解处理情况，尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确)，网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据，平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺，下载前须认真查看，确认无误后再购买，务必慎重购买；若有违法违纪将进行移交司法处理，若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传，付费前请自行鉴别，如您付费，意味着您已接受本站规则且自行承担风险，本站不进行额外附加服务，虚拟产品一经售出概不退款（未进行购买下载可退充值款），文档一经付费（服务费）、不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印，是因预览和防盗链等技术需要对页面进行转换压缩成图而已，我们并不对上传的文档进行任何编辑或修改，文档下载后都不会有水印标识（原文档上传前个别存留的除外），下载后原文更清晰；试题试卷类文档，如果标题没有明确说明有答案则都视为没有答案，请知晓；PPT和DOC文档可被视为“模板”，允许上传人保留章节、目录结构的情况下删减部份的内容；PDF文档不管是原文档转换或图片扫描而得，本站不作要求视为允许，下载前自行私信或留言给上传者【宇***】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用；网站提供的党政主题相关内容(国旗、国徽、党徽－－等)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
6、文档遇到问题，请及时私信或留言给本站上传会员【宇***】，需本站解决可联系【微信客服】、【 QQ客服】，若有其他问题请点击或扫码反馈【服务填表】；文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“【版权申诉】”（推荐），意见反馈和侵权处理邮箱：1219186828@qq.com；也可以拔打客服电话：4008-655-100；投诉/维权电话：4009-655-100。