文本生成式绘画的创作主体性及创造力研究.pdf
《文本生成式绘画的创作主体性及创造力研究.pdf》由会员分享,可在线阅读,更多相关《文本生成式绘画的创作主体性及创造力研究.pdf(5页珍藏版)》请在咨信网上搜索。
1、52基金课题0 引言艺术长期以来被视为仅有人类才能企及的高台,是人类的专有领域。而将人类艺术的绘画概念引入人工智能图像生成技术,是技术在艺术创作中的尝试,是科学与艺术融合的探索。所谓人工智能绘画,主要指在人工智能的帮助下创作出艺术性的数字图像。事实上,人工智能图像生成早已存在,但过去的技术仅能生成简单的低质量图像,且只有少数专业领域人员才能接触使用,大多数企业和公众并未意识到其潜力价值,也未引起社会广泛关注。然而,文本生成图像式扩散模型的诞生改变了一切。高清图像与超乎想象的画面带来了一次又一次的视觉冲击,引发了对人工智能绘画在创作表现上的多维思考。人工智能模型是否具有创作主体性及创造力,成为当
2、前面临的重要议题。1 创作主体性的变化艺术家是艺术品的生产者和创作者,是艺术创作活动的主体。在传统绘画创作中,艺术家在创作主体性上占据绝对权威。其在全部的艺术思维过程中具有独立的、不受外界干扰的选择和判断能力,能够顺应自己对艺术的独到理解,充分把控具体创作过程,尽情发挥艺术意志,最终创作出完美的艺术作品。然而,在文本生成式绘画中,操作者仅需输入文本提示,人工智能模型就能依据提示生成画作。整个创作过程中,人类对画面的掌控仅来自文本提示,且这种掌控是间接性的,是经由人工智能“理解”后实现的作品。人工智能对艺术创作的介入,人类在艺术创作中的权利让渡,引发了关于人工智能绘画创作主体性的争议。一些学者认
3、为,艺术创作主体性是指艺术家在创作过程中表达个性、情感、思想和价值观的特性,而人工智能只是一种技术工具,不能代替人类的审美和创造力。另一些学者则认为,人工智能可以模仿人类的艺术样式和法则生成具有美感的作品,从而展现出一定的艺术创作主体性。通常,创作主体性以创作中是否具有掌控力、作品是否为纯粹意志体现等为判断依据。在文本生成式人工智能绘画中,创作内容由文本提示主导,创作形式由算法实现。因此,文本提示效用在衡量创作主体上起到了关键作用。当人类提供高质量文本提示促使人工智能生成符合其意志的作品,使其成为创作想法的执行者时,人类在创作中处于主要地位。当文本提示仅为开启程序自动化的指令或保留较大的创作空
4、白时,人工智能将代替人类作出选择,成为创作主体。文本生成式绘画的创作主体性及创造力研究张笑娟(四川大学 艺术学院,四川 成都 610207)摘要:目的:人工智能相关技术的突飞猛进,大大推动了科技与艺术的交融。在绘画领域引入人工智能图像生成技术,是技术在艺术创作中的探索,是绘画界对人工智能的尝试,为绘画艺术带来了创新性和无限可能性。文本生成式高清图像与超乎想象的绘画作品给人们带来了极大的视觉冲击,引发了人们对人工智能绘画在创作表现上的多维思考。如何理解文本生成式绘画的创作主体性及创造力,成为一个重要议题。方法:为深入探讨文本生成式绘画的创作主体性及创造力,文章通过梳理文本生成式人工智能绘画的创作
5、过程,分别从人类与技术的角色、关系和作用入手,分析文本生成式绘画中的创作主体性及创造力问题,阐明文本生成式人工智能绘画创作主体性的动态变化关系,总结人类与人工智能模型在该创作中发挥创造力的衡量方式及具体途径,并引入人机协同艺术概念及特点,展望其未来。结果:通过分析,可以得知人类与技术在人工智能绘画创作中并无绝对主体性,二者的创作关系是动态变化的,创作地位视具体参与方式及程度而定,只能针对具体案例进行分析。结论:在艺术创作领域,人机协同是艺术创作未来发展的方向之一,人机协同艺术将有望引领人类迈入“全民艺术家”时代,实现艺术“民主化”。关键词:文本生成式绘画;人工智能;创作主体性;创造力;人机协同
6、艺术中图分类号:J20-05;TP18文献标识码:A文章编号:1004-9436(2024)02-0052-04基金项目:本论文为2023年度四川大学大学生创新创业训练计划项目“美术理论视域下的人工智能绘画研究以midjourney 程序为例”成果,项目编号:C202312622653第 37 卷第 2 期 2024 年 1 月Vol.37 No.2January 2024艺术科技不可否认的是,在艺术作品所承载的情感体验方面,人工智能是缺失的。算法设置是客观的,选择倾向由概率决定,不涉及主观情感。但如果把目光转移到具有人类主观意志的文本提示上时,也并不能将其与最终作品完全挂钩。作品呈现受到了人
7、工智能介入,人类无法直接将心灵体验进行视觉呈现。总体而言,人类与技术在人工智能绘画创作中并无绝对主体性,二者的创作关系是动态变化的,创作地位视具体参与方式及程度而定,只能针对具体案例进行分析。不过,参与方式的间接性并不影响人类发挥主观能动性调节创作主体的关系。最新的midjourneyV4 版本在文本生成图像的基础上推出了垫图功能(imageprompting)。人类可以在输入文本提示的同时提供基础图像,模型将结合该图像及提示内容生成作品。这种方式给予了作品一定的视觉约束,能够在很大程度上提升人类在人工智能绘画创作中的主体性及掌控力,是对作品总体方向的把控。在未来人工智能绘画的严肃应用场景下,
8、以发挥人类与人工智能各自优势为目的的创作主体调节将成为二者在具体创作方式上创新发展的重要依据。2 人工智能绘画创造力判断文本生成式人工智能绘画创作主体性的动态变化关系使其生成作品的创造力判断受到极大的挑战。传统艺术创作中,艺术家为作品所赋予的创造力似乎成了伪命题,程式化的算法运行与人类主控的让渡使人工智能绘画是否具有创造力饱受争议。普遍观点以人类艺术家创作为标准,从经历、情感、理念等方面衡量人工智能绘画创作,并判断其缺乏创造意识而属于“复制”“模仿”一类。Adobe 集团产品营销经理塔蒂亚娜梅希亚(TatianaMejia)提出:“创造力在很大程度上是人性的,人工智能无法取代创意火花。”北京大
9、学艺术学院丁宁教授指出,艺术家最敏感于自身所处的时代,现实与命运永远是其体验和思究的对象,而从人工智能绘画产品中仅能分析出程序算法的理性,也由此失去了艺术特有的感性基础1。相反,利用人工智能创作埃德蒙德贝拉米肖像的艺术团体在新闻采访中则声称,“人工智能成功地创造了艺术”“创造力不仅属于人类”。清华大学美术学院的吴琼教授也认为人工智能可以通过算法生成新的形式,并以一定程度的“独立性”完成创作2。由于文本生成式人工智能绘画的创造力判断受到人类和模型的共同影响,因此其创造力讨论可以从“人类创造力”和“人工智能模型创造力”这两个视角展开。2.1 人类创造力人工智能绘画的创作并不是仅由人工智能模型及算法
10、技术来实现的,其是人和模型共同作用的结果,最终作品的呈现由人和机器交互控制实现。因此,对于人工智能绘画创造力的分析,首先不能忽略人类创造力在作品生成中的影响。一般而言,人类创造力以三种方式发挥作用:一是模型的设计开发,如选择架构、数据、优化方法等;二是与模型交互,如提供文本提示、反馈生成作品等;三是受模型输出图像启发、反思等。三种方式对应开发人员、操作者、观众三方参与者,多数情况下,操作者与观众是同一主体。其中,操作者直接对生成作品结果产生影响。模型输入端的文本提示由操作者提供,文本描述的内容源自操作者的主观选择,但对于其是否发挥创造作用,需要针对具体过程展开分析。乔纳斯奥本兰德(JonasO
11、ppenlaender)对此提出了两种输入场景,一种为操作者随机获取文本片段用于图像生成,另一种为输入他者创作的文本。两种场景的区别在于第一种完全不包含任何主观构思,第二种则为可能受操作者误读的文本复制。乔纳斯认为,在以上两种场景中,人类不一定需要发挥想象力,与模型的互动除基础的语言辨识外,既没有技能又没有创造性,最终生成的图像只是“一个不完美的人的创造力代表”3。那么操作者发挥创造力的途径有哪些呢?具体方式共有三种。第一种为优化文本提示内容,通过发挥人类主观意志撰写描述性和富有想象力的文本提示,使用不同的词、句式和修饰,指导模型生成新颖多样的图像。对理想作品进行风格、比例定义,以及参数调整,
12、也是产生高保真图像的关键。第二种为迭代文本提示组合,即探索不同的文本样式、组合及其他可以修改或优化生成图像的提示。乔纳斯在对 midjourney社区的研究中发现,一些新手常常用较长而具体的提示试图生成惊艳的画作,但结果不尽如人意。相反,另一些人仅用简约的提示就能毫不费力地生成美丽的图像,这实际上涉及文本提示的有效性问题。输入有效提示是一种体现对训练集和神经网络潜在空间认识程度的技能。来自美国哥伦比亚大学的刘薇安(VivianLiu)和莉迪亚奇尔顿(LydiaB.Chilton)54基金课题通过实验研究,提出了一套文本提示设计指南,从不同维度考察了理想图像生成的成功模式和失败模式,并在 mid
13、journey 和 DALLE2 这两个文本生成图像式模型上进行了实践4。例如,提示应相对简短,控制在 60 个单词或 400 个字符以内;尽量使用英文字符,因为大多数模型是用英语训练的,英文字符能够提高图像与提示的一致性;遵循一定的输入模板:描述风格尺寸;使用正确的语法和清晰的语义,避免模糊和歧义等。第三种为筛选策划反馈图像。从多个输出中筛选符合预期或目的的最佳图像,或对生成图像进行编辑、修改、再生成等来表达自己的想法。在midjourney 中,系统会根据首次输入的文本提示生成4 个低分辨率图像。操作者可以使用每个图像网格下的按钮对图像进行放大、变体或重启。从作品接受角度来看,当人工智能绘
14、画作品能够引起观众的情感反应,深化人类对人工智能的认知理解,以及拓宽科学与艺术的可能性、促进相关行业产业发展、调动全民艺术参与积极性时,可以视其为对社会产生了创造力。例如,赢得科罗拉多州博览会(ColoradoStateFair)数字艺术比赛大奖的人工智能绘画作品太空歌剧院(ThtreDopraSpatial)就引起了全社会对人工智能绘画合法性及版权归属的争议探讨,并在此基础上产生了多项研究。2.2 人工智能模型创造力关于人工智能模型是否具有创造力是目前最具争议性的话题,也是一些狭隘观点下评判人工智能绘画是否具有创造力的直接依据。抛开其中的人类作用,算法模型本身是否具有创造力?如何理解和定义这
15、种有别于人类主观意识的创造?这些问题都有待思考。文本生成图像模型(Texttoimagemodel)是机器学习中一种重要的模型,以自然语言输入,并生成与文本提示相匹配的图像。不同于以往的图像生成方法GANs 和 VAEs,这些模型使用一种新兴的生成神经网络去噪扩散模型来生成图像。该模型通过逐步添加高斯噪声破坏训练数据,擦除数据中的细节,直到它变成纯噪声,然后通过训练神经网络来反向扭转这种破坏过程逐渐去噪以合成纯噪声的数据,直到重新产生干净的样本。哈佛大学卡洛斯庞塞实验室的一项研究认为,扩散模型逐渐向初始轮廓添加细节来创建图像的工作模式,实际上和画家从草图不断完善至最终成稿的作画方式十分类似5。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 文本 生成 绘画 创作 主体性 创造力 研究
1、咨信平台为文档C2C交易模式,即用户上传的文档直接被用户下载,收益归上传人(含作者)所有;本站仅是提供信息存储空间和展示预览,仅对用户上传内容的表现方式做保护处理,对上载内容不做任何修改或编辑。所展示的作品文档包括内容和图片全部来源于网络用户和作者上传投稿,我们不确定上传用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的版权、权益或隐私,请联系我们,核实后会尽快下架及时删除,并可随时和客服了解处理情况,尊重保护知识产权我们共同努力。
2、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据,个别因单元格分列造成显示页码不一将协商解决,平台无法对文档的真实性、完整性、权威性、准确性、专业性及其观点立场做任何保证或承诺,下载前须认真查看,确认无误后再购买,务必慎重购买;若有违法违纪将进行移交司法处理,若涉侵权平台将进行基本处罚并下架。
3、本站所有内容均由用户上传,付费前请自行鉴别,如您付费,意味着您已接受本站规则且自行承担风险,本站不进行额外附加服务,虚拟产品一经售出概不退款(未进行购买下载可退充值款),文档一经付费(服务费)、不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
4、如你看到网页展示的文档有www.zixin.com.cn水印,是因预览和防盗链等技术需要对页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有水印标识(原文档上传前个别存留的除外),下载后原文更清晰;试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓;PPT和DOC文档可被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;PDF文档不管是原文档转换或图片扫描而得,本站不作要求视为允许,下载前自行私信或留言给上传者【自信****多点】。
5、本文档所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用;网站提供的党政主题相关内容(国旗、国徽、党徽--等)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
6、文档遇到问题,请及时私信或留言给本站上传会员【自信****多点】,需本站解决可联系【 微信客服】、【 QQ客服】,若有其他问题请点击或扫码反馈【 服务填表】;文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“【 版权申诉】”(推荐),意见反馈和侵权处理邮箱:1219186828@qq.com;也可以拔打客服电话:4008-655-100;投诉/维权电话:4009-655-100。