谷登堡时刻:Sora背后信息传播的范式转变与变革逻辑.pdf
《谷登堡时刻:Sora背后信息传播的范式转变与变革逻辑.pdf》由会员分享,可在线阅读,更多相关《谷登堡时刻:Sora背后信息传播的范式转变与变革逻辑.pdf(15页珍藏版)》请在咨信网上搜索。
1、2024.3 1谷登堡时刻:Sora背后信息传播的范式转变与变革逻辑引言:Sora冲击波:人类传播的又一次根本性变革Sora的突现令世人瞩目,收获诸多赞誉。一时间所有人都想知道,该模型到底是如何运作的,它是根据什么数据进行训练的,为什么现在突然发布它,它的真正用途是什么,以及它未来的发展对行业、全球劳动力、整个社会和环境的影响如何,等等。Sora展现了文本、图片和视频等各类媒体之间无缝的自动化生产与跨越的全新可能性,与一年前的ChatGPT一样,掀起全球舆论的又一场冲击波。但是迄今为止,对Sora的认识主要停留在新闻效应层面,即从技术、产品、应用和资本等层面所谷登堡时刻:Sora 背后信息传播
2、的范式转变与变革逻辑方兴东 钟祥铭内容摘要:Sora展示了文本生成视频的“世界模拟器”的全新可能性,标志着媒介生产自动化与媒体形态一体化的临界点,开启了人类传播史上又一“谷登堡时刻”。我们需要超越技术、产品、应用和资本等层面,从人类传播变革的角度,为理解Sora提供一个更加开阔而深入的视角。现代印刷术开启的“谷登堡时刻1.0”通过工业化信息生产和传播方式实现了信息传播持续线性增长的潜能,跨越长达数百年的大众传播时代,塑造并定义了现代社会。而AI技术开启的“谷登堡时刻2.0”通过数据和算法实现了信息传播的指数化增长,代表了人类传播的又一次根本性变革,开启了智能传播新时代。这一轮变革颠覆并重构了人
3、在信息传播中固有的主体地位,AI生成内容将占据绝对主导,全新的人机融合的合成社会即将到来。如何驾驭技术变革带来的前所未有的高度不确定性和模糊性,成为最大挑战。我们亟须进一步把握当前这场智能传播浪潮的规律与本质,以全新的问题域去审视和反思技术、传播与社会的互动。关键词:Sora;生成式人工智能;AIGC;ChatGPT;智能传播;谷登堡时刻课题:中央高校基本科研业务费专项资金;国家社科基金重大项目“互联网环境下新闻理论范式创新研究”(编号:21&ZD318)DOI:10.3969/j.issn.2095-0330.2024.03.001谷登堡时刻:Sora 背后信息传播的范式转变与变革逻辑本刊特
4、稿2 MODERN PUBLISHING 现代出版本刊特稿本刊特稿作的解析和主观研判。也就是说,对以ChatGPT和Sora等轰动性应用为代表的AIGC浪潮,各界的认识主要还停留在感性认识层面,部分上升到知性层面,还缺乏系统性的理性认识。人类传播变革为我们理解Sora提供了一个更加开阔的视角。在诸多命名和论断中,“谷登堡时刻2.0”可能是最恰当也是最贴切的命名。人类正处于一个“加速、扩增和民主化”的时代。从印刷术的发明到科学革命、工业革命和核能革命,再到个人计算机和互联网,托马斯L.弗里德曼(Thomas L.Friedman)将当前的生成式AI时刻称作人类的“新普罗米修斯时刻”。他认为,相较
5、于以往的变革,当前的变革并非由单个的发明如印刷机或蒸汽机所推动,而是由一系列相互关联和增强的技术进步组成的超级循环所驱动。这个技术超级循环包括了从感知世界、将物理信息数字化、处理数据、机器学习、分享信息到采取行动的全过程,人工智能在这一循环中起到了重要作用。同时,我们不该忽视传播在这个技术超级循环过程中所扮演的核心角色,它是连接各个技术环节的关键纽带。从感知世界到采取行动的过程中,信息的生产和分发是至关重要的。人工智能不仅进一步加速了这个过程,还推动着社会信息传播范式的转变。在这个意义上,我们可以说Sora冲击波的本质是人类传播继谷登堡现代印刷术之后的又一次根本性变革。显然,ChatGPT和S
6、ora仅仅是这一轮技术浪潮的开端而已,更多突破性的技术、产品与应用还将层出不穷。但是,这一切都离不开“谷登堡时刻”的基本逻辑和框架。那就是,15世纪中叶现代印刷术的诞生,使图书出版从手工作坊走向工业化生产。而今,人类信息生产和传播超越人的环节进入一个数据和技术驱动、信息量可以实现指数级持续增长的全新时代。今天的人类社会,显然还没有为迎接这一新时代做好基本的准备。也因此,ChatGPT和Sora会带来如此巨大的全球震动。一、观察Sora的三个视角及“三个时刻”对于现代印刷术的影响,启蒙运动者格奥尔格克里斯托弗利希滕贝格(Georg Christoph Lichtenberg)说:“比起弹丸中的铅
7、,排字盒中的铅更多地改变了世界。”虽然围绕Sora的评价众说纷纭,但是,结合年鉴学派费尔南布罗代尔(Fernand Braudel)的时段理论,基本上可以分成三个视角:技术和产品层面的短时段视角,产业格局和行业变革的中时段视角,以及社会传播变革与人类文明进程的长时段视角。三个视角交织综合在一起,造成人们对Sora认知和评价的多样性。我们围绕三个视角,概括Sora引发的变革,可以发现几个著名的“时刻”。一个是“iPhone时刻”。2023年3月23日GTC大会上英伟达CEO黄仁勋将ChatGPT的出现比喻为“iPhone时刻”,其特指一个革命性的转变时刻乔布斯在2007年发布的第一代iPhone
8、,标志着手机行业迎来了重大变局。从技术、产品和应用视角,以开启移动时代的“iPhone时刻”来比喻,很生动直观。另一个是“卫星时刻”,也被称为“Sputnik时刻”。苏联在1957年发射人类首颗人造卫星Sputnik 1,苏联这一划时代成就当即在西方世界引发了一场“卫星地震”,尤其是在美国人当中唤起了一种强烈而复杂的感受。因此,以“Sputnik时刻”来比喻国家创新和科技发展面临的挑战,形象贴切。2024.3 3谷登堡时刻:Sora背后信息传播的范式转变与变革逻辑克劳斯-吕迪格马伊(Klaus-R diger Mai)将谷登堡称为“500年前塑造今日世界的人”。“或许可以说,谷登堡的印刷机是从
9、中世纪晚期进入近代的社会范式彻底转变的标志,因为它通过改变传播而深刻地影响了人们的生活,从而改变了社会。”更重要的转折是,“个体一个此前无人了解的思想史单位从此踏上了世界的舞台,之前还依赖于上帝的主体迅速成为行为者和决策者。在传播领域,个体成为作者,个人获得的著作权保障了其作为作者的身份。人一跃成为创造者,而且也自知这一身份。”因此,如果要更宏观、深入、系统地洞察Sora冲击波的变革与影响,我们认为将其称为“谷登堡时刻”,更契合本质,也更富有学理。传播是人类和社会存在的基本方式。一部人类传播史,就是一部人类文明史。回顾人类信息传播变革的历程,我们会发现,无论是互联网还是ChatGPT,抑或是S
10、ora,都是传播变革宏大进程中的一朵浪花。它们并非突如其来的创新,而是历史演进逻辑中的一个关键节点。从传播历史的维度审视Sora的意义,可以发现更深远的进程和逻辑。如果说15世纪中叶谷登堡推动印刷术普及引发的变革可以称为谷登堡时刻1.0,那么,今天ChatGPT和Sora引发的革命可以称为谷登堡时刻2.0。谷登堡时刻1.0开启大众传播时代,确立了人的主体性。而谷登堡时刻2.0正式开启智能传播时代,将颠覆并重构人的固有主体地位。AI生成内容将占据绝对主导,人机融合的全新的合成社会(Synthetic Society)将到来。生成式AI以及深度伪造、类人机器人、增强现实和虚拟现实等技术建构的合成社
11、会,将从人类生存方式上模糊真实和虚拟的界限。这几个“时刻”可以大致对应于布罗代尔的短时段、中时段和长时段的划分。当然,它们之间的界限并不是泾渭分明的,而是有着相当程度的重合。不同的视角为我们理解Sora呈现了不同的逻辑,具有不同的深度和广度。从人类传播历史进程看,这一轮以ChatGPT和Sora等生成式AI为代表的智能传播的新突破,很可能开启第二次谷登堡时刻。正如基辛格等人所言,“生成式AI提出了自启蒙运动以来从未经历过的哲学和实践挑战。一项新技术(生成式 AI)正试图改变人类认知过程,这是自印刷术发明以来从未经历过的震动随着它的能力变得更广泛,它们将重新定义人类知识,加速我们现实构造的变化,
12、并重组政治和社会”。尽管生成式 AI技术的研究仍处于起步阶段,但随着技术的迭代和各种AI 应用和产品的发展,这项颠覆性技术或成为撬动第四次工业革命的杠杆,引发包括传播机制变革、生产方式变革、科研范式变革、教育形式变革和生活方式变革等在内的人类社会更深层次的变革,从而彻底改变人类的生活、学习和工作方式,甚至人类的思维。其最大的变革就是实现了以数据和AI技术驱动的信息传播的指数级增长。表1 观察Sora的三个视角及对应的三个时刻常用时刻时段事件时间侧重点时间侧重功能iPhone 时刻短时段2007 年技术和产品个体时间文生视频Sputnik 时刻中时段1957 年行业与国家社会时间世界模拟器谷登堡
13、时刻长时段15 世纪中叶社会与文明地理时间信息传播机制谷登堡时刻:Sora 背后信息传播的范式转变与变革逻辑4 MODERN PUBLISHING 现代出版本刊特稿本刊特稿相较于智能传播,20世纪8090年代的网络传播和21世纪头10年的社交传播,处于两次谷登堡时刻的过渡阶段。互联网革命的短短30年间,人类信息传播从大众传播、网络传播、社交传播转变为智能传播。全局性的革命似乎才真正启航,而过去30年更像是一场“超级热身赛”。当然,目前这一变革浪潮的序幕才刚刚拉开,其未来演进的图景和产生的影响,依然充满更多的未知和风险。二、谷登堡时刻的共同特性:高度的不确定性和模糊性迄今为止,人们对Sora影响
14、的预测可谓悲喜交加。OpenAI声称,Sora将成为实现通用人工智能(AGI)的重要里程碑,是朝着AGI迈出的关键一步。特别是随着Sora技术的发展和普及,AI在创造性任务中扮演的角色将持续拓展。目前透露出的状况正预示着各行各业都将经历一次创新和变革的浪潮。Sora不仅仅是一个视频生成模型,作为一个能够模拟世界的“数据驱动的物理引擎”,它能够从大量真实世界的视频中理解物理定律和现象。人们对Sora的主要担忧是其社会和道德影响。Sora的出现可能会进一步模糊真实与虚构之间的界限,涉及大量的深度伪造和虚假信息,从而加剧“后真相”状况,我们无意中建立了一个“宣传引擎”(propaganda engi
15、nes)的世界,并越来越接近难以区分真假的时代。作为一个先进的AI视频生成模型,Sora能够提供更直观的3D建模和动画工具,促进教育和培训,加快电影和游戏制作流程,推动虚拟现实和扩展现实内容的创新。但它也可能导致影视、游戏、广告和短视频等相关行业的运行模式出现变革,而大量失业则将构成重大社会风险;Sora改善和简化视频叙事的同时,也可能加剧互联网虚假信息传播,助长政治传播和社会偏见等风险;它还可能被用来影响选举,危及公共卫生措施,甚至可能因潜在的虚假证据而给司法系统带来负担。史蒂文利维(Steven Levy)称Sora可能成为“虚假信息的大灾难”(misinformation train w
16、reck)。加州大学伯克利分校的哈尼法里德(Hany Farid)认为,Sora技术如果与AI 驱动的语音克隆(voice cloning)相结合,可能为深度伪造开辟出一个全新前沿。因此,如何确保Sora这样的先进技术不会成为虚假信息的传播工具成为一项巨大挑战;如何防范其被用于制造虚假信息、恶意误导公众将成为一个亟待解决的社会议题;如何界定机器生成视频的版权归属、防止滥用侵权行为成为法律法规和伦理规范需要面对的重要问题;监管层和技术开发者共同面临着来自隐私安全问题的严峻考验。从短期来看,Sora可以被视为一种工具,在技术维度仍然有很多问题需要解决,但有评论家提醒人们不该忽视Sora的双重性。A
17、I是资本逻辑在当代的重要体现。对于OpenAI来说,Sora的重点不止于视频,还应考虑其战略维度。通过消费者产品、企业销售以及开发者社区建设,OpenAI在当前的人工智能领域占据了领先地位。具体而言,通过消费者产品和企业解决方案的实践,OpenAI不断提升其技术水平,为生成式模型设立了新的标准。同时,通过社区建设,其AI应用更为广泛和深入。在对AGI的定义和目标上,OpenAI也不断探索着这一领域的边界,试图定义和构建未来AGI的可能形态。此外,ChatGPT和Sora等生成式 AI对人类全量知识进行整合的能力,对以知识传授为主的教育理念带来了巨大挑战。当我们探索Sora能力2024.3 5谷
18、登堡时刻:Sora背后信息传播的范式转变与变革逻辑的含义时,还必须考虑生活在一个眼见不再可信、真实与人造之间的界限变得越来越模糊的世界给人带来的心理影响,其可能引发关于信任、信仰以及数字增强世界中人类经验本质的重要问题。这种巨大的不确定性和模糊性,同样发生在印刷革命之后。事实上,直到今天,围绕印刷术的社会影响及其变革意义,依然存在极大的分歧。这一方面涉及究竟如何认识传播在社会建构和变革中的角色与作用,另一方面涉及关于技术对传播的影响与作用机制的认识。迄今为止,人们对信息传播在人类社会发展中的重要性,都缺乏基本的认识,其经常从属于政治、经济和技术等因素。而事实上,传播更可能是政治、经济和社会,甚
19、至也是技术发展演进的关键因素。马克思认为:“火药、指南针、印刷术这是预告资产阶级社会到来的三大发明。火药把骑士阶级炸得粉碎,指南针打开了世界市场并建立了殖民地,而印刷术则变成了新教的工具,总的来说变成科学复兴的手段,变成对精神发展创造必要前提的最强大的杠杆。”马歇尔麦克卢汉(Marshall McLuhan)更加突出了印刷术对资本主义经济发展的关键作用。印刷术引起工业革命“事实上,活字印刷是一切装配线的祖先”。美国史学家、传播学家,媒介环境学派代表人物伊丽莎白爱森斯坦(Elisabeth Eisenstein)认为,作为文艺复兴、宗教改革、科学革命三大思想运动的“变革动因”,印刷术是一个完全独
20、立的技术构件,对当时及其后的政治、经济、社会等方面都有重要影响。她对各学科广泛认可并引用的马克斯韦伯的新教伦理与资本主义精神中对资本主义起源和西方理性化内在动因的解析,以及更被广泛引用的托马斯库恩(Thomas Kuhn)的科学革命的结构对科学范式转变的内在原因的分析,都提出了强有力的质疑,并都将印刷术掀起的大众传播作为上述变革真正的根本动因。马克斯韦伯主张新教伦理观念和生活方式为资本主义精神的形成提供了重要的精神动力。他认为,新教徒对勤勉工作的重视、对世俗事务的合理安排,以及对经济成功作为神赐福分的解读,为早期资本主义的发展提供了道德上的正当性和精神上的推动力。然而,他忽略了“这一切都和宗教
21、思想的传播有关,没有印刷机,宗教改革这样一场重大的革命是不可能完成的”。印刷术的出现是新教革命重要的先决条件。它使知识的存储和传播更为便捷和广泛,从而加快了知识积累的速度;通过大量复制而保持一致的文本,为封建传统知识权威的崩溃和现代知识体系的建立铺平了道路,为资本主义和理性化的兴起提供了更为具体和实质性的基础。爱森斯坦的研究提供了一个清晰的逻辑来解析资本主义和西方理性化的复杂起源,即传播革命是加强韦伯所说的新教伦理与资本主义精神之间关系的一个决定性因素。爱森斯坦还提供了一个新的视角,用以理解科学知识如何在早期现代欧洲得以迅速传播和接受。托马斯库恩聚焦于科学领域内部的变化,讨论了科学理论和实践中
22、的范式转变,即科学发展并非通过逐步积累知识,而是通过一系列的革命性转变,这些转变涉及基础理论和观念的根本性更替。科学共同体在一个稳定的范式下工作,直到积累起来的反常现象和问题导致现有范式不足以解决,随后发生一场科学革命,产生新的范式。而爱森斯坦则认为,印刷术的发明和普及使得科学知识可以更广泛、更迅速地传播,使更多的人能够接触到这些知识,并参与到科学辩论和研究中。这种信息传播的加速可能促使了科学理论的更迅速接受6 MODERN PUBLISHING 现代出版本刊特稿本刊特稿和集体思维的变化,从而有利于科学范式的形成和更替。同样,将传播视为变革的最根本驱动,来理解和研判Sora的发展趋势和社会变革
23、,可能才是最经得起中长时段检验的视角。技术不仅仅是一个工具或者平台,其传播和采纳过程实际上是一个动态的、交互的过程。作为技术体系的传播逻辑不仅是参与控制的内在机制的形式,更多是参与社会构建的阐释机制的增量。换言之,智能技术的传播方式不仅影响信息的控制和管理(包括算法、数据处理和用户界面设计等),也影响信息的社会构建作用的发挥。它深度参与社会认知的形成和价值观的塑造,并在社会构建中逐渐形成新的社会实践、交流方式和思维模式。三、Sora文本生成视频的原理与机制如何理解Sora冲击波,首先需要从其底层的核心技术革新和潜在发展来理解其意义。同时,这也将为理解此类技术对传播学所产生的冲击的内在驱动力提供
24、基础。了解这些技术的本质和发展轨迹对于预见它们将如何影响传播至关重要。Sora在技术层面被视为“视频生成的GPT-2时刻”。它的主要功能是将文本描述转化为视频内容,这一过程的核心在于解析语言表达背后的复杂场景和动态视觉信息。正如OpenAI在其技术论文中所解释的,Sora是基于之前在图像数据生成建模方面的研究而构建的,如图像生成器DALL-E和GPT大语言模型等。以往的研究采用了循环网络、生成对抗网络(GANs)、自回归Transformer和扩散模型等多种方法,但其往往专注于某一狭窄的视觉数据类别、较短的或固定大小的视频。Sora则超越了这些限制,并且在生成不同持续时间、宽高比和分辨率的视频
25、方面有了显著的改进。它通过结合对语言的深刻理解和视觉上下文以及准确解释提示来保持叙事的一致性,从给定的提示中捕捉角色的情感和个性,并将它们作为富有表现力的角色特征在视频中呈现出来。处理视觉数据的统一表征(unified representation of visual Data)是Sora技术的核心突破,对于大规模训练生成模型以及生成各种视觉内容的能力而言必不可少。从视觉数据到视觉子块(visual patches)的转变是Sora处理视觉内容的关键,即将图像分割成序列化的时空子块(Spacetime Patches),并将其作为视频处理的基本单位。简言之,Sora 是通过对视频数据的学习来理
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 谷登堡 时刻 Sora 背后 信息 传播 范式 转变 变革 逻辑
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。