」中的「n_batches」设置一次生成多少张图(变体),也即如果此处输入 5,则最终可以得到 5 张图(图越多需要的时间越长)。将以上重要参数设置完成以后,在页面的上方点击「代码执行程序」按钮,在菜单中选择「全部运行」后程序即开始运算。免费用户一般分配到的是 Colaboratory 的 Tesla K80 显卡电脑,线上渲染速度比较慢,一张默认尺寸和迭代次数的图大概需要一个半到两小时才能完成。如果等不及的也可以选择「连接到本地运行时」用自己电脑的显卡进行渲染,但是需要用到「Jupyter 笔记本服务器」等工具,这里就不作展开了。接下来便是漫长的等待过程,拉到「Diffuse。
」底部时你可以看到自己的图片从一片模糊到逐渐清晰的变化过程。▲ 程序底部有运算持续时间和目前步骤显示根据之前程序提供的默认语句,我生成了一张海上灯塔的图片,画面效果一流,用来做桌面背景完全没问题。接下来我又改动了一些参数,再生成了两张图,描述语句如下:「A painting of a robot angel, flapping her wings in the night sky by Shirow Masamune, Trending on artstation, blue color scheme(一张机械天使在夜空中挥动翅膀的画,士郎正宗创作,以 Artstation 为参考库,蓝色配色)」▲ 默认画质,耗时 1.5 小时「Cyberpunk station(赛博朋克车站)」▲ 448448 像素,耗时 45 分钟首先这两张图片都可以算得上是切题。「机械天使」图虽然没能体现「夜空」这个关键词,但构图有特色,天使也能展示出明显的机械感,至于画有没有士郎正宗的神韵就见仁见智了。在「车站」图的上方我们能看到列车、电缆等要素,红色、绿色的霓虹灯、屏幕等也是典型的赛博朋克元素,美中不足的就是完成度不高。NightCafe Creator:风格迁移神器相比起 Disco Diffusion,NightCafe 用起来就简单多了。NightCafe 的网页提供了两款智能绘图工具,左边的「Text to Image(文本转图像)」是类似于 Disco Diffusion 的输入关键词生成图工具,右边的「Style Transfer(风格迁移)」可以把用户上传的照片换成名画风格。先来测试第一个功能。在「Your text prompt」下方的方框中输入关键词,如:A city surrounded by machine(被机械保包围的城市),然后在下方 16 种风格选取一个。拉到底部选择是纹理优先(Artist)还是构图优先(Coherent)后点击最下面的「CREATE」,等待几分钟,一张方形的图就生成了。▲ 成图过程如果不满足于默认图像的尺寸,你还可以在关键词输入界面打开「Show advanced options(显示高级选项)」。在此模式下你不仅能自定义图像的尺寸,还可以设定多张参考的底图。风格转移工具的使用也很简单。上传一张照片,从 64 种名画风格中挑选一个,再等 1-2 分钟,一张惊艳的图片就诞生了。将之前灯塔、车站和天使的关键词去掉作者和参照库后输入到 NightCafe Creator ,我们得到了以下三张图片。▲ 关键词:一座在汹涌的血海中闪耀的奇异灯塔,黄色配色。▲ 关键词:一张机械天使在夜空中挥动翅膀的画,蓝色配色▲ 关键词:赛博朋克车站所有图片里效果最好的个人认为是天使的画,虽然走的是较为抽象的路线,但那一双像卫星的太阳能接收翼的翅膀还是体现出了机械和天使的组合元素,角色的动作也很生动,在 AI 的启发下我忍不住也参照着画了一张。▲ 自认没有 AI 画得有意思赛博朋克车站的效果中规中矩,而灯塔图的效果就很一般了,画面中出现了很多相似的灯塔,能看起来是为了铺满画面而多次复制导致的。Cogview:中文关键词,一次八张图Cogview 是本次测试中唯一支持中文输入的 AI 工具(字数限制为 2-30 中文字符),由清华大学的唐杰团队研发,出图时间为 1-5 分钟不等,一次可以生成八张图,但尺寸不可调。从输入英文关键词网页会翻译为中文再运算这一点推断,该程序应该是以汉语为语言进行训练的,在一堆只能用英文输入的同类 AI 中显得难能可贵。▲ 该团队去年发表的论文其实这款程序最擅长的是真实的照片生成,而非艺术绘画。比如当我们输入「黄豆组成的字母 b」时,AI 会给我们八张符合描述的真实照片。▲ 已在各个搜索引擎确认过网上并无现成的类似图片而之前的 NightCafe Creator 无论怎么切换风格也只能产出类似下图的「艺术作品」。当关键词是与绘画有关时, Cogview 就略逊一筹了,比如当我们想用「Oil Painting Style(油画风格)」风格生成一座之前描述的塔,八张成图还是更像照片而非画作。赛博朋克车站的画面效果要好很多,可能是由于本身是建筑物,而且该描述本身也适合写实风格。在重新生成灯塔的图时为了让它更像画作,我切换成了水墨风格。Cogview 是这么多款 AI 里面唯一真实地还原了「sea of blood(血海)」的,不过有点诡异就是了。机械天使的油画出图效果就一言难尽了,八张成图都过于抽象,难以评价。不过据说我们现在习惯了的俊美人形带洁白翅膀的天使形象其实是文艺复兴时期经过美化的。《旧约》中描述的天使的外貌本就是千奇百怪的,毕竟天使是超越人类认知能力的存在,怎么可能和人长得一样呢?▲ 旧约中描绘的座天使WOMBO Dream:界面美观,作品重艺术感WOMBO Dream 这款工具我们曾经在另外一篇介绍 AI 绘画的文章里介绍过,它的界面我认为是本次介绍的几款中最好看的,成图时间也是几款中最短的,约为 30 秒。操作过程和 NightCafe Creation 很像这里就不赘言了,直接上图。▲ 关键词:一张机械天使在夜空中挥动翅膀的画,蓝色配色▲ 关键词:一座在汹涌的血海中闪耀的奇异灯塔,黄色配色。▲ 关键词:赛博朋克车站由于该程序只支持最多 100 个英文字母的输入,有些关键词我们不得不进行删减。从三张图片中我们可以看到 WOMBO Dream 的成图十分追求「画感」。所谓「画感」,简单来说就是让人一看就会认为这一张画出来的作品,而不像摄影或者 3D 模型摆拍。当然,程序自带的塔罗牌式画框对「画感」的形成也许有帮助。▲ 在画廊中右键另存为可以保存不带画框的图片总结现在对四款 AI 作图工具进行一个简单总结,首先所有程序都是网页版,且免费使用。Disco Diffusion 可以实现最复杂的关键词描述,可自设置的参数很多,是一个待探索的巨大宝库,但是成图时间长,操作界面也相对复杂。NightCafe Creator 和 WOMBO Dream 都能快速产出作品,前者可以对画面尺寸进行设置,也能容纳更多的关键词,但后者界面更好看,出图自带画框。Cogview 的好处是支持中文关键词,在现实照片生成这方面有优势,无法自定义图片尺寸。在多款 AI 设计工具火热以后,有人开始担心画家的工作会不会被取代。在 Disco Diffusion 爆红以后,公众号设计青年实验室请了几位设计大咖探探自己对 AI 作画的感受,其中插画师疯景这样说道:「如果有一天 AI 取代了更多的价值,那么我会努力去寻求新的价值,船到桥头自然直。」生产力的发展带来的是生产方式的变革。我们都知道印象派的诞生是源于 19 世纪摄影技术的发明,当人们意识到无论怎么画都不可能比照相机逼真的时候, 朦胧、个性、抽象等反而成为弥足珍贵的东西。▲ 莫奈的代表作《日出印象》如今,AI 画手的出现又重新对我们的艺术界发出了挑战,艺术家们为捍卫领土又会以什么样的策略迎战呢?我们不妨拭目以待。Disco Diffusion: https://colab.research.google.com/github/alembics/disco-diffusion/blob/main/Disco_Diffusion.ipynbCogview:https://agc.platform.baai.ac.cn/CogView/index.htmlWOMBO Dream:https://www.wombo.art/NightCafe Creator:https://creator.nightcafe.studio/
(图片来源网络,侵删)
0 评论