(纯属个人意见,欢迎来喷。
)第22名:ModelScope2023年3月,第一个引起互联网关注的文本到视频人工智能生成器ModelScope发布。人工智能视频生成器很简单,只生成2秒的剪辑,具有奇怪的扭曲,很像早期的人工智能图像生成器。它的许多视频也带有 Shutterstock 的标志,暗示着它从哪里收集培训数据。这款名为 ModelScope 的人工智能文本转视频系统于3月18日发布,它的2秒视频片段显得笨拙,往往令人抓狂,但也已经引起了一些轰动。电商巨头阿里巴巴的研究部门达摩视觉智能实验室(DAMO Vision Intelligence Lab)创建了该系统,作为一种公开测试案例。根据该公司描述其人工智能模型的页面,该系统使用非常基本的扩散模型来创建视频。第21名:Zeroscope一些新的模型正在ModelScope原型的基础上创建,包括Zeroscope_v2,一个开源模型家族。这创造了比ModelScope更高质量的视频,XL版本可以将其升级到1024x576分辨率。它可以在HuggingFace上找到。如果你使用别人的公共空间,从模型生成视频可能需要很长时间,但结果本身就很有趣。实际上,文本到视频仍处于早期阶段。给它一个简单的提示,比如“穿过森林的人”,你会收到一个相当简单的你所要求的内容。给它任何更深奥或不精确的东西,它会吐出一些非常狂野的视觉效果。需要明确的是,我更喜欢一些风格更奇怪的,但人们相互变形并不是我在提示中想要的。第20名:Runway Text to VideoRunway.Ml 备受炒作的文本到视频生成器,是你能得到的最好的版本,但这更能说明这些生成器需要走多远,才能创建出与大多数其他人工智能图像生成器一样强大的东西。大多数视频都包括一个简单的平移或推拉镜头,而屏幕上的拍摄对象则漫步或凝视远方。图片质量与Runway的文本到图像生成器非常相似(如果您认为上面的视频看起来类似于不同的幻灯片,则它是稳定扩散的前身)。Runway模型的好处是,你可以让视频播放超过10秒,而其他模型的限制要大得多。在公司要求用户注册该公司的付费订阅之前,用户会收到略高于100秒的视频生成时间。虽然Runway制作的视频质量比其他两款要高得多,但它只是一个可爱的噱头。简而言之,从文本到视频很酷很有趣,但它还有很长的路要走。第19名:Pixray我在Pixray的免费网站上使用Replicate的标准vqgan引擎,创建了两幅非常令人困惑的图像,其中一幅可以被解释为对沙漠外观的现代艺术诠释。这是一个较老的系统,仍在使用生成对抗性网络算法的功能。这只是一个因素,但图像需要相当长的时间来处理,即使这样,它们的分辨率也非常低。第18名:Deep AIDeepAI相当简单和初级的AI生成器没有很多花哨的东西,实际上,它也没有太多其他的东西可供选择。文本到图像的API系统没有更新的系统所具有的花哨功能。这些图像更多的是互联网上找到的图像的拼贴,而不是任何真正试图创造某种“新”东西的尝试。第17名:Craiyon该系统曾被称为Dall-E Mini,现在被称为Craiyon,最初的目的是提供一个快速、免费的人工智能图像生成器,帮助人们度过难关,直到OpenAI的Dall-E 2完全发布。该模型在发布一年多后迎来了几次更新,尽管它更像是一种预付资金的业务。您可以生成一些不同质量的图像,但分辨率非常低。要实现任何升级,你需要付清费用。如果你不想要水印,你还需要支付一些现金。该模型发布了相当多的输出,但没有一个是特别好看的。第16名:Shutterstock AI Image GeneratorShutterstock与同时代的一些stock service公司不同,它在人工智能生成的内容上一马当先。该公司于去年年底开始为人工智能内容的销售提供便利,并与DALL-E创作者OpenAI签署了一项协议。若要访问生成器,用户需要注册Shutterstock。虽然你可以使用该服务下载图片,但那些没有订阅的人仍然需要为生成的每张图片付费,所以很难称之为真正的“免费”。因此,尽管这些图片的质量比其他图片好一些,但这就是为什么它最终在列表中排名靠后的原因。今年早些时候,Shutterstock发布了基于DALL-E 2的人工智能图像生成器。该服务生成四张约500x500像素的图像,与一些竞争平台相比,这是相当可观的。用户可以在五种不同的“样式”之间设置输出,使生成的图像看起来“3D”或更像数字照片。像这个列表中的所有其他生成器一样,我们使用了最基本的输出,并收到了一些令人惊讶的结果。该系统生成了几个相当有趣的受太阳启发的“钟摆”图像,尽管与所有人工智能图像生成器一样,它显然在直线和网格方面存在问题。该系统的灵感明显来自绘本风格,这几乎可以被认为是艺术性的,除了错位的手臂和沿着女人背部奔跑的尴尬阴影。另一个考虑因素是 Shutterstock 声称它是如何使用贡献者的照片和图像来训练人工智能的。该公司已承诺通过所谓的“贡献者基金”来补偿那些图像训练了人工智能的贡献者。图像贡献者根据上传到网站的图像数量获得蛋糕的相应“份额”。第15名:Hotpot AIHotpot.Ai 的艺术生成器是一个相当初级的程序,但自从我们第一次尝试它以来,它已经变得更强大了。该公司还在宣传不同的功能,比如从照片中移除物体和背景的工具,尽管这些确实需要花钱。整个“免费”方面是Hotpot最受伤害的地方。制作缩略图大小的小图片是免费的,但做更多的事情,包括调整大小或允许“商业用途”,都需要付费。我们对生成的图像质量感到惊讶,特别是每一张图像都肯定有很多经典的科幻和奇幻感觉,但免费版本的限制对它的伤害最大。第14名:Runway.MLRunway ML是为我们提供Stable Diffusion的两家初创公司之一,其免费的文本到图像服务与早期开源版本的软件具有相同的质量。据《福布斯》报道,随着Runway继续获得数百万美元的投资资金,该公司已经转向基于人工智能的视频编辑工具和图像扩展服务,以及其他可定制的人工智能工具套件,其中大多数需要付费才能充分利用它们。但对于这项免费服务,用户在被要求升级之前只能获得25张图片,这与其他服务相比并不是很好。当使用这些非特定的提示时,图像的实际质量还有很多需要改进的地方。此外,和Stable Diffusion一样,Runway也对类似封面的假文本着迷。第13名:Dream StudioDream Studio测试版AI艺术生成器是免费的,它拥有许多其他AI艺术生成器所不具备的功能,如缩放图像的宽度和高度,同时告诉它你希望图像与提示的距离有多接近。它是由Stability AI开发的,该公司最近发布了一个更受欢迎的AI艺术生成器。这个系统的速度也快得惊人,从上面的例子中你可以看到,AI并不害怕随心所欲地混合和匹配艺术风格。不幸的是,使用我的提示导致了一些有趣的演绎,但也有一些奇怪的衍生图像。当我多次使用“A Memory Called Empire”提示时,我收到的图像都是没有人类语言的破碎文字,几乎就像一本外星人的书的封面。这是一个信号,表明系统真的希望我给它更多的信息,告诉它去剽窃某个特定的艺术家。当你给它一个艺术家的名字来复制时,它会做得更好,但在这方面它与我们介绍的下一个AI艺术生成器相似。第12名:Stable Diffusion关于Stability AI的免费艺术生成器,当它还处于内测阶段时,已经有很多人说过了,但是在8月22日,免费图像生成器终于得到了完整的发布,从那时起,它就成为了最受关注的图像生成器之一。与Dall-E或Google的Imagen(仍然公开不可用)相比,Stable Diffusion是开源的、免费的、未经过滤的。它在hug Face上的基本页面相当简陋,但你可以用一些简单的免费软件工具让它更容易使用,尽管你必须安装Python才能使它工作。据其网页介绍,Stable Diffusion 依赖于一个基于LAION-5B数据集的模型,该模型可以过滤掉带有水印的图像和徽标。根据科技博主安迪·拜奥的一篇报道,许多图片主要来自Pinterest和其他照片和艺术博客。我们试图让它创造自己的艺术,而不是告诉它模仿某个特定的艺术家,但基本上没有成功。它一直给我提供没有任何风格或内容的黑白图像。在不要求它复制特定艺术家的情况下,与其他用户所获得的作品相比,它只提供了相当令人失望的作品。当你明确要求系统按照特定艺术家的风格进行创作时,它似乎更擅长创作艺术。当然,这也带来了一系列的道德问题,特别是对于那些被人们模仿的活着的艺术家来说,就像幻想艺术家Greg Rutkowski在接受媒体采访时所说的那样,他担心以他的名字命名的假人工智能艺术的数量会超过他自己的知名度。第11名:VQGAN+CLIP你一定会喜欢免费软件,这个基于python的Google Colab笔记本相对容易使用,所以真的,你必须为一个相对简单、开放、对所有用户可用的系统给予主要的支持。您只需转到链接,向下滚动,并在文本框中输入提示,然后按Ctrl+F9或Runtime-Run All。当然,我们正在对系统的艺术能力进行排名。系统会逐步迭代设计,这样你就可以看到人工智能试图对每一张图像进行哪些处理。我的提示提供了一些非常有趣的结果,但也有一些令人费解的地方。第10名:StarryAIStarryAI已经将其模型从基于GaN的艺术生成器更新为更新的扩散模型,但不知何故,它不那么有趣了。这些图像比以前放大了很多,但新的图像可以产生衍生作品,虽然它们本身看起来很有趣,但实际上并没有太多的亮点。人工智能艺术生成器有一个相当干净的基于Web的界面,可以让你创建几种风格的图像,但常规的StyleVisionXL只提供了相当通用的外观。仅根据图像,它使用了一个版本的稳定扩散,所以不要期望太超出标准的东西。你每天会收到少量积分,你可以用这些积分生成四个提示版本。同样,如果不为每个提示添加细节并请求特定的样式,生成的图像就不会有太多的效果。第9名:Deep Dream Generator谷歌的Deep Dream Generator声称,它可以将图像转换成程式化的艺术作品。网站上的主要图片确实让它看起来很有吸引力,但当然,要让young Skip的照片看起来不仅仅是一只用Photoshop滤镜处理过的狗,这并不容易。我们把young Skip描绘成彼得·勃鲁盖尔(Pieter Bruegel)的风格,这位著名的荷兰艺术家创作了《盲人引导盲人》(the Blind Leading the Blind)等作品。结果……还好。我试着做了一个曼陀罗图案,很有趣。然后我在风格中添加了一幅萨尔瓦多·达利的画,结果很无聊。这是一个有趣的工具,但我觉得我是在玩一本复杂的彩色书,而不是产生任何真正的艺术。第8名:NightcafeNightcafe系统只允许你在付费前制作几张图片,但像其他一些人工智能图像生成器一样,它为用户提供了各种不同风格的选择。它希望用户购买“积分”来制作更多图像,或提高每张图像的质量和分辨率,而这些积分很快就会用完。到处都是艺术品。我很欣赏它在《被剥夺者》中所做的努力,但它甚至不会在其他两个提示中创造一个看起来像人类的人。图像分辨率也不高,即使在默认的油画设置中,艺术也很奇怪。当然,能够先试用一下这个系统,看看你是否喜欢它,这很好,但即使每月只花10美元,我也不能说你找不到更好的选择。第7名:Wombo DreamWombo Dream系统允许您创建多种风格的艺术,例如老式复古艺术,萨尔瓦多达利或“吉卜力”。我根据每本书的风格选择了不同的风格。它还允许你添加一个Dream可以使用的参考图像,但我已经将该系统限制在它自己的想象中。您也可以将图像转换为NFT。我不得承认Wombo;其中一些艺术确实令人回味无穷。我特别喜欢Throwback滤镜,因为它绝对给了它20世纪70年代的艺术风格,你可能会在旧专辑封面上看到。不过,正如你所看到的,它的解释非常松散。我从它对《帝国记忆》的解读中得到的奇怪的情色感觉很奇怪,因为这不是提示。它对《太阳摆下》的诠释让我很惊讶,所以它得到了相当高的分数。第6名:DALL-E2Dall-E 2可能是最受期待的人工智能图像生成器,因为它最初是在4月份发布测试版的。然而,正如这些例子所示,有多个版本可以利用AI艺术热潮赚钱。9月28日,DALL-E的制造商OpenAI终于向公众发布了他们的系统。像许多其他系统一样,它为用户提供了50个免费提示,每个月还会增加几个。用户还可以为更多的图像生成积分付费。至少可以说,我们在DALL-E的经历很有趣。我发现这个系统对特定艺术家的计算不太好,即使你给它很详细的说明,它也默认为印象派艺术风格。当然,这不是这个排名想要做的。为此,我更感兴趣的是每个人工智能系统在不给它一个特定复制的图像的情况下,能够独立完成什么。DALL-E的系统显然借鉴了大量真实的照片和艺术,但它们在很大程度上仍然无法复制人脸。然而,生成器似乎确实喜欢《一个叫做帝国的记忆》的提示,它提供了几个鼓舞人心的图像,捕捉到了这本书的精髓。Dall-E3已经推出大约一年了,但到目前为止,访问它的唯一方式是支付ChatGPT Premium。然而,这也留下了Bing Image Creator,它也使用Dall-E3的一个版本。第5名:Adobe FireflyAdobe Firefly Image 2是一个有趣的野兽。首先,这款基于网络的应用程序有一个完全免费的计划,每月提供25个积分。与其他在线服务相比,这已经相当不错了。第二,它使用了该公司的人工智能模型,该模型只使用其库存网站上的图像,无论好坏。在这种情况下,实际的输出感觉非常基本。将其转变为“艺术”内容类型,将产生非常适合广告的输出。这还不足以让你的朋友们刮目相看,但只要你注册Adobe的网站,网站本身就能提供相当多的东西。第4名:Stable Diffusion 2.1由Stability AI开发的第一款 Stable Diffusion 的续作可能很难称自己为完整的迭代。不过,11月下旬发布的新系统在很多方面都比上一代有了升级。在其公告博客中,Stability AI指出,它已经引入了一种由LAION开发的新文本编码器。这个开源项目还提供了Stable Diffusion所使用的大量图像集。据Stability AI智能公司称,“Stable Diffusion 2”还能以更好的分辨率显示图像,并且在放大图像方面也做得更好。他们还提到它有更强的景深功能,不过在我们自己的测试中,并没有提到这一点。当使用该系统生成开放式提示时,我对生成的一些图像的清晰度感到惊讶。我希望AI生成的图像不需要提及任何特定的艺术家、风格或格式。在没有提示它以任何一个人为基础的情况下,该系统仍在努力生成一个逼真的头部。尽管如此,我还是对它为我的“太阳下钟摆”提示的结果感到惊讶。奇怪的是,每次我向 Stable Diffusion 2 输入我的《一个叫做帝国的记忆》提示时,它都会出现一个漫画风格的显示。我选择了最好的一个,但特别令人担忧的是,系统想要继续复制文本。这是更多的证据,表明该系统可能从实际漫画和漫画家的扫描中借鉴了多少。第3名:Bing Image Creator微软与OpenAI的合作,为我们带来了ChatGPT in Bing和Bing in ChatGPT。不过,它也允许任何拥有微软账户的人每天访问99个人工智能生成图像的免费提示。该网站说,如果你没有提示,那么系统将需要花费更长的时间。必应图像创建器本质上是在必应网页中找到的Dall-E3模型,所以它已经具备了明显的功能。每个提示符能创建4个1024 × 1024的图像,这显然与OpenAI的产品一样先进。让这个系统更好的是你可以免费得到多少提示。不仅如此,它还对我的奇怪提示做出了一些有趣的解释。当然,它仍然是微软的,这个工具最令人讨厌的部分是每个生成图像底部明显的水印。第2名:CatBird AICatBird是继2022年末的大繁荣之后又一个出现的人工智能图像生成器网站,它已经是最有力的竞争者之一,尤其是在许多其他服务限制了免费选择的情况下。它没有运行任何特定的生成人工智能模型,而是同时运行一系列模型,包括Opentravel、Dream-like Diffusion和Stable Diffusion等。它们是根据照片真实感、动漫风格或幻想风格来组织的。默认情况下,系统的输出基于单个提示的多个模型,并以512乘512的像素比例一次创建三个图像,尽管目前可以免费升级这些图像。这些图片本身就非常吸引人,尤其是当你从每一张图片中获得各种各样的风格时。提示还自动生成“最好的质量,高质量”等单词,试图给用户带来更好的结果。最终,该服务将开始提供“专业”付费版本,该版本将加快等待时间,一次提供六张图像,每次提示提供更多模型。该系统也没有账户功能,但CatBird确实在其Discord上告诉用户,该公司正在开发一项功能,让用户保存自己的图像,以便以后升级。第一名:Leonardo.aiLeonardo的主页包括一系列独立的AI图像模型,但主要的Leonardo Diffusion工具有一个相当大的选项套件,用于创建不同的图像。您可以为生成的图像设置分辨率大小,并决定是否使用该工具的额外功能来提高每张新图片的对比度。当然,启用更多设置和升级映像将花费更多令牌。一开始你可以收到150张,但如果你想要最好的照片,这些钱很快就会用完。订阅费每月12美元起,但如果你注册一年,可以享受折扣价。这些图像本身就非常惊人。它们很容易成为Midjourney中最具风格化的作品之一,但不幸的是,关于Leonardo使用的是哪种模型的信息就更少了。用户甚至可以用不同的图像训练自己的模型来微调结果,但这不是这个排名的目的。不再免费(目前):Midjourney AIMidjourney 无疑是最好的AI美术生成器之一,尽管它绑定了自己的Discord服务器。它曾经是免费的,但不幸的是,从去年开始,这项服务现在需要订阅。对于那些曾经在Midjourney聊天中寻找乐趣的人来说,这是一个痛点,他们想看看互联网上的人到底想让系统产生什么。有一天,它可能会重新推出免费版。在那之前,还是有很多物美价廉的平替可供选择。如果朋友们喜欢,敬请关注“知新了了”。
(图片来源网络,侵删)
0 评论