ChatGPT团队背景研究报告.pdf
《ChatGPT团队背景研究报告.pdf》由会员分享,可在线阅读,更多相关《ChatGPT团队背景研究报告.pdf(25页珍藏版)》请在咨信网上搜索。
1、 I 2023.022023.02 II 内容提要 ChatGPT 团队规模不足百人(共 87 人)。分析发现,其显著特征是“年纪很轻”、“背景豪华”、“聚焦技术”、“积累深厚”、“崇尚创业”和“华人抢眼”。该团队平均年龄为 32 岁,“90 后”是主力军。他们引领的这一波大型语言模型技术风潮,充分说明了那些经常被认为研发经验不足的年轻人,完全有可能在前沿科技领域取得重大突破。团队成员绝大多数拥有名校学历,且具有全球知名企业工作经历。从成员毕业高校分布看,校友最多的前 5 大高校是斯坦福大学(14 人)、加州大学伯克利分校(10 人)、麻省理工学院(7 人)、剑桥大学(5 人)、哈佛大学(4
2、人)和佐治亚理工学院(4 人)。另外,该团队有 3 人是我国清华大学校友,即翁家翌、赵盛佳、袁启明,他们本科均在清华大学就读,目前均在团队担任研发工程师一职。ChatGPT 不一味强调高学历,其成员并非“清一色”的研究生学历,而是本、硕、博人数相对均衡。团队成员有 10 人从谷歌跳槽加入,其他成员也大多来自 Facebook、Stripe、Uber、Quora、NVIDIA、Microsoft、Dropbox、DeepMind、Apple、Intel 等顶尖或知名科技公司。另外,该团队有 5 人被评为 2023 年度“AI 2000 全球人工智能学者(全名单链接:https:/ 2 人为 Op
3、enAI 联合创始人,2 人分别被评为全球机器人和机器学习领域最具影响力学者。可见,技术型顶尖学者对创新型团队的引领作用至关重要。从成员职位构成看,该团队成员近 9 成为技术人员,未配备技术与产品之外的职能人员(如公共关系、市场营销等人员),而是高度聚焦于技术研发。由此可见,在数字化传播时代,一款人工智能产品只要性能足够优异,即使未配置专人做推广营销,也能在短短的一两个月时间内在全球引爆。III ChatGPT 是 OpenAI 在大型语言模型领域多年技术积累的结果。统计发现,在与ChatGPT 相关的先前 7 大技术项目研发中,ChatGPT 团队成员参与人数最多的是 CodeX项目,共有
4、22 人参与过,占总团队人员总数的 25%;其次是 webGPT 和 instructGPT,共有 9 人参与过;第三是 GPT3,共有 6 人参与过;第四是 RLHF,共有 3 人参与过。由此可见,ChatGPT 团队成员在生成式预训练语言模型领域有较深厚的技术积累,特别是 1/4团队成员曾参与过同样基于 GPT3 的 CodeX 项目的研发经验,对后续成功研发 ChatGPT打下了坚实的基础。数据来源:AMiner 科技情报平台 图 ChatGPT 团队参与先前 7 大技术研发人数 分析发现,该团队成员不再把进入“大厂”作为首选,而是更倾向于选择更加创新潜力的创业机构。团队成员大多是从“大
5、厂”跳槽,以及作为应届生加入,其次就是从相对“稳定”的科研机构和高校教职岗位离职后加入。即使从 ChatGPT 团队离职的 4 位成员,也仍然选择加入创业公司或机构。300622990510152025RLHFGPT1GPT2GPT3codeXInstructGPTwebGPTChatGPT团队参与人数(人)ChatGPT先前七大技术项目 IV 数据来源:AMiner 科技情报平台 图 ChatGPT 团队成员流动示意图 ChatGPT 团队中的华人表现抢眼。团队共有华人 9 人,占团队总人数 10%。其中 5 人本科就读于中国内陆高校,3 人大学教育经历均在美国高校完成。梳理毕业于中国内陆高
6、校的 ChatGPT 华人成员成长路径发现,他们就读于中国内陆顶尖高校的学习阶段均为本科,之后赴美深造,获得硕士或博士学位,然后加入美国诸如 Dropbox、OpenAI 等创新型公司。表 ChatGPT 团队中的华人成员 姓名 职务 毕业院校 工作单位(按时间顺序排列)翁家翌 研发工程师 学士:清华大学 硕士:卡内基梅隆大学 OpenAI 赵盛佳 研发工程师(MTS)学士:清华大学 博士:斯坦福大学 OpenAI 江旭 研发工程师(MTS)学士:华中科技大学 博士:马里兰大学帕克分校 Mythic;OpenAI V 姓名 职务 毕业院校 工作单位(按时间顺序排列)袁启明 研发工程师 学士:清
7、华大学 硕士:德克萨斯大学奥斯汀分校 Dropbox;OpenAI 翁丽莲 AI 应用研究经理 学士:北京大学、香港大学 博士:印第安纳大学伯明顿分校 Dropbox;Affirm;OpenAI 肖凯 深度学习研究员 学士:麻省理工学院 博士:麻省理工学院 OpenAI Steph Lin 研究员 学士:麻省理工学院 硕士:佐治亚理工学院 牛津大学(人类未来研究所);OpenAI 欧阳龙 高级研究员 学士:哈佛大学 博士:斯坦福大学 Self-Employed;OpenAI 张马文 信息缺失 博士:加州大学伯克利分校 加州大学伯克利分校;OpenAI 数据来源:AMiner 科技情报平台 华人
8、学者欧阳龙参与了与 ChatGPT 相关的 7 大技术项目中的 4 大项目的研发,他是InstructGPT 论文的第一作者,是 RLHF 论文的第二作者,可见他是这两个关键技术项目的核心人员。根据以上分析所获相关启示,就国内人工智能前沿技术发展提出以下建议:1)注重科技兴趣和信仰培育,鼓励优秀年轻人投身于前沿技术创新浪潮;2)“大厂”前沿科技创新疲态显现,鼓励年轻人将目光投向创业公司;3)海外华人学者是全球科技创新的重要力量,鼓励加强对外学术交流。VI 目 录 内容提要 II 一、职位分工:近 9 成为技术人员,高度聚焦技术研发 1 二、年龄分布:“90 后”科研“后浪”显示强大创新能力 2
9、 三、教育背景:绝大多数拥有名校学历,6 人毕业于中国高校 3 四、人员流动:10 人从谷歌跳槽加入,1 人曾在百度任职 5 五、华人成员:在国内完成本科学业,后赴美深造并就业 7 六、成员贡献:1/4 成员参与过 codeX 研发,欧阳龙表现突出 8 七、性别特征:团队由男性主导,女性仅占 1 成 10 八、2023 年“AI 2000 学者”入选情况:5 位顶尖学者入选 12 九、启示与建议 13 附件:ChatGPT 团队全体成员名单(87 人)15 1 2022 年 11 月 30 日,OpenAI 公司(美国致力于人工智能研究的非营利机构)发布了由大型语言模型驱动的自然语言处理工具
10、ChatGPT。该工具通过学习和理解人类语言,能够与用户进行高质量对话,甚至还能撰写邮件、视频脚本、文案、代码、论文和小说等。由于在同行中具有较卓越的性能,ChatGPT 推出仅 2 个多月的时间即引爆全球。除了关注ChatGPT 性能本身外,业内人士更关注该 AI“梦之队”成员到底具有哪些特征,才促使他们在全球大型语言模型创新技术领域如此独领风骚。根据 OpenAI 官网显示,为 ChatGPT 项目做出贡献的人员共 87 人(名单详情见附件)。现就该团队成员职务构成、年龄分布、教育背景、人员流动、华人成员、成员贡献、性别分布等数据进行统计分析,并总结归纳其特征。一、职位分工:近 9 成为技
11、术人员,高度聚焦技术研发 从 ChatGPT 团队职位分工看,研发人员共 77 人,占比 88%,其中含 1 名公司联合创始人,即 Wojciech Zaremba(被评选为 2023 年 AI 2000机器人领域最具影响力学者);产品人员共 4 人,占 5%。另外,6 人职位信息无法获取。从成员职位构成看,该团队未配备技术与产品之外的职能人员(如公共关系、市场营销等人员),而是高度聚焦于技术研发。由此可见,在数字化传播时代,一款人工智能产品只要性能足够优异,即使未配置专人做推广营销,也能在短短的一两个月时间内在全球引爆。https:/ 2000 全球人工智能学者”名录涵盖了 20 个核心主题
12、领域和一些新兴领域。每年从过去 10 年中来自各领域排名前 10 名的学者被命名为“AI 2000 最具影响力学者”,前 11-100 名学者被命名为“AI 2000最具影响力学者提名”。因此,每年将有约 200 名最具影响力学者,从 2020 年至 2029 年 10 年将形成一个由约 2000 名学者组成的名录,他们正在推动 21 世纪 20 年代人工智能各个领域的创新和进步。参阅网址:https:/ 2 数据来源:智谱研究根据公开资料统计 图图 1 ChatGPT 团队职位构成 二、年龄分布:“90 后”科研“后浪”显示强大创新能力 从 ChatGPT 团队年龄分布看,2029 岁的成员
13、有 28 人,占全体成员(剔除年龄信息缺失的 5 位成员)的 34%;3039 岁的共 50 人,占 61%;4049 岁的仅 3 人,无5059 岁年龄段的成员,60 岁以上的有 1 人。经计算,该团队平均年龄为 32 岁。由此可见,“90 后”是这支团队的主力军,他们引领了这一波大语言大模型技术的创新风潮,这说明经常被认为研发经验不足的年轻人,完全有可能在前沿科技领域取得重大突破。数据来源:AMiner 科技情报平台 图 2 ChatGPT 团队年龄分布 研发人员;77;88%产品人员;4;5%未知;6;7%5103502800102030405060信息缺失60及以上5059404930
14、39202920以下人数(人)年龄段(岁)3 三、教育背景:绝大多数拥有名校学历,6 人毕业于中国高校 在 ChatGPT 团队中,27 人具有本科学历,25 人为硕士研究生学历,28 人拥有博士研究生学历(注:5 人信息缺失),占比分别为 33%、30%、37%。作为全球人工智能顶尖研发团队,其成员学历并非“清一色”研究生学历,而是本、硕、博人数相对均衡。数据来源:智谱研究根据公开资料统计 图 3 ChatGPT 团队学历分布 从 ChatGPT 团队成员毕业高校分布看,斯坦福大学校友最多,共 14 人;其次是加州大学伯克利分校,共 10 人;第三是麻省理工学院,共 7 人;我国清华大学与卡
15、内基梅隆大学并列第 7 名,各有 3 人。该团队成员毕业人数前 10 名的高校(见下表)均有 2 人及以上人数分布,共计 54 人;排名第 10 之后的高校均只有 1 人,其中不乏全球顶尖大学,如牛津大学、东京大学、康奈尔大学、加州大学圣巴巴拉分校等。总体看,ChatGPT 团队成员绝大部分拥有全球顶尖或知名高校学位;另外,其毕业院校相对分散,前 3 强高校只占总人数的 37%。学士/本科33%硕士研究生30%博士研究生37%4 表 1 ChatGPT 团队成员毕业人数前 10 名高校 排名 毕业高校 校友人数(人)1 美斯坦福大学 14 2 美加州大学伯克利分校 10 3 美麻省理工学院 7
16、 4 英剑桥大学 5 5 美哈佛大学 4 5 美佐治亚理工学院 4 7 美卡内基梅隆大学 3 7 中清华大学 3 9 美莱斯大学 2 9 波华沙大学 2 数据来源:AMiner 科技情报平台 在 ChatGPT 团队中,有 6 人曾毕业于中国高校,其中 3 人本科毕业于清华大学,各有1 人本科毕业于华中科技大学、北京大学/香港大学,1 人硕士研究生毕业于台湾交通大学(如下表所示)。表 2 毕业于中国高校的 ChatGPT 团队成员名单 姓名 职务 曾就读中国高校 学位阶段 翁家翌 研发工程师 清华大学 本科 赵盛佳 研发工程师(MTS)清华大学 本科 5 姓名 职务 曾就读中国高校 学位阶段
17、袁启明 研发工程师 清华大学 本科 江旭 研发工程师(MTS)华中科技大学 本科 翁丽莲 AI 应用研究经理 北京大学、香港大学 本科 Phil Tillet 研发工程师(MTS)台湾交通大学 硕士研究生 数据来源:AMiner 科技情报平台 四、人员流动:10 人从谷歌跳槽加入,1 人曾在百度任职 ChatGPT 团队成员主要来自外部公司(81%)、高校应届毕业生(13%)、科研机构(4%)和高校教职人员(3%)等(如下图所示)。其中人数来源最多的外部企业是谷歌,共 10 人跳槽加入;来源人数超过 2 人(含)以上的外部企业还有 Facebook、Stripe、Uber、Quora、NVID
18、IA、Microsoft、Dropbox、DeepMind 等知名科技公司。作为应届生直接加入 ChatGPT 团队的共 11 人,其中 5 人来自加州大学伯克利分校、3 人来自斯坦福大学,麻省理工学院、卡内基梅隆大学和哈佛大学各 1 人。可见,在 ChatGPT 团队中,不论是来自其他企业,还是作为应届生加入的人员,他们的背景都相当“豪华”。6 数据来源:AMiner 科技情报平台 图 4 ChatGPT 团队成员流动示意图 监测发现,ChatGPT 研究员 Heewoo Jun 曾在 2015-2019 年间在百度(美国研究院,Sunnyvale,California,USA.)担任研究员
19、,2019 年从百度离职后加入 OpenAI 担任研究员至今(如下表所示)。表 3 曾在中国公司任职过的 ChatGPT 团队成员 姓名 职务 履历 Heewoo Jun 研究员 2019-至今,OpenAI,研究员 2015-2019,百度(美国研究院),研究员 2013-2015,斯坦福大学,硕士研究生 2008-2013,多伦多大学,本科 数据来源:AMiner 科技情报平台 到目前为止,ChatGPT团队已离职员工有4人(离职率为4.6%),他们是Jacob Hilton、Igor Babuschkin、Matthias Plappert 和 Andrew Carr,去向分别为 Ali
20、gnment Research Center、DeepMind、Github 和 Gretel.ai。可见,从 ChatGPT 团队离职的人员,并非为外界想象的加入所谓“大厂”,而是仍然选择具有创新潜力的创业公司或机构。7 五、华人成员:在国内完成本科学业,后赴美深造并就业 ChatGPT 团队有 9 位华人(名单见下表)。其中 5 人本科就读于在中国内陆高校,3人大学教育经历均在美国高校完成,1 人(张马文,Marvin Zhang)信息不全。梳理毕业于中国内陆高校的 ChatGPT 华人成员成长路径发现,他们就读于中国内陆顶尖高校的学习阶段均为本科,之后赴美深造,获得硕士或博士学位,然后加
21、入美国诸如 Dropbox、OpenAI等创新型公司。表 4 ChatGPT 团队中的华人成员 姓名 职务 毕业院校 工作单位(按时间顺序排列)翁家翌 研发工程师 学士:清华大学 硕士:卡内基梅隆大学 OpenAI 赵盛佳 研发工程师(MTS)学士:清华大学 博士:斯坦福大学 OpenAI 江旭 研发工程师(MTS)学士:华中科技大学 博士:马里兰大学帕克分校 Mythic;OpenAI 袁启明 研发工程师 学士:清华大学 硕士:德克萨斯大学奥斯汀分校 Dropbox;OpenAI 翁丽莲 AI 应用研究经理 学士:北京大学、香港大学 博士:印第安纳大学伯明顿分校 Dropbox;Affirm
22、;OpenAI 肖凯 深度学习研究员 学士:麻省理工学院 博士:麻省理工学院 OpenAI 8 姓名 职务 毕业院校 工作单位(按时间顺序排列)Steph Lin 研究员 学士:麻省理工学院 硕士:佐治亚理工学院 牛津大学(人类未来研究所);OpenAI 欧阳龙 高级研究员 学士:哈佛大学 博士:斯坦福大学 Self-Employed;OpenAI 张马文 信息缺失 博士:加州大学伯克利分校 加州大学伯克利分校;OpenAI 数据来源:AMiner 科技情报平台 六、成员贡献:1/4 成员参与过 codeX 研发,欧阳龙表现突出 ChatGPT 是 OpenAI 公司在大型语言模型领域多年技术
23、积累的结果。与 ChatGPT 相关的先前关键技术项目有 RLHF(Reinforcement Learning from Human Feedbac,人类反馈强化学习)、GPT1、GPT2、GPT3、codex、InstructGPT、webGPT等 7项。统计发现,ChatGPT 团队中,有 2 人参与了其中 4 项关键技术项目的研发,他们是高级研究员欧阳龙和研发工程师 Christopher Hesse。他们均为机器学习领域专家。华人欧阳龙是 InstructGPT 论文的第一作者,是 RLHF 论文的第二作者,可见他是这两个关键技术 RLHF 论文 Learning to Summar
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- ChatGPT 团队 背景 研究 报告
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【宇***】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【宇***】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。