MidJourney vs. Stable Diffusion vs. 必应图像创作者

人工智能正在以令人瞩目的方式改变艺术界。在艺术领域中,人工智能的一种迷人应用是利用描述性艺术生成器。这些生成器能够检查和解释图像,并基于其分析生成全新的艺术作品。

在本文中,我们讨论了三种这样的人工智能艺术生成器:midjourney、stable diffusion和microsoft bing image creator,并根据提示来确定三者中生成最佳结果的是哪一个。

midjourney

midjourneydavid holz创立,是一种利用机器学习识别现有艺术作品中的模式和特征,并利用它们创作新作品的人工智能艺术生成器。

midjourney于2022年7月12日进入公开测试阶段。在创立midjourney之前,holz共同创立了leap motion,这是一家通过利用视频捕捉和手势操作改变用户界面的初创公司。2019年,他将leap motion出售给ultrahaptics

随着midjourney的受欢迎程度不断上升,holz分享了他对技术及其对艺术和社会的影响的见解。holz认为艺术家是midjourney的客户,而不是竞争对手,并且相信该平台可以促进构思阶段的更大创造力和实验性。

然而,人们对于midjourney的训练集中可能包含其他艺术家的受版权保护作品的潜在版权侵权问题表示担忧。

holz强调,midjourney的设计是为了增强人类能力,而不是取代它们。他将其比喻为汽车,解释道尽管汽车比人类更快,但这并不意味着我们应该切断腿。

通过使用midjourney的人工智能图像生成,艺术家可以在创作自己的作品之前探索新的可能性并生成大量想法。

stable diffusion

stable diffusion是一个开源的机器学习模型,可以根据文本生成图像、基于文本修改图像,或者填充低分辨率或低细节图像的细节。它经过了数十亿个图像的训练,可以产生与dall-e 2和midjourney相媲美的结果。

emad mostaque是stable diffusion的创始人兼首席执行官,stable diffusion是由慕尼黑大学计算机视觉组(compvis)的patrick esser和robin rombach设计的潜在扩散模型。stable diffusion是由stability ai、compvis lmu、runway、eleutherai和laion合作共同向公众提供的。

stable diffusion可以在windows和apple设备等各种平台上部署。在应用中使用设备端部署可以保护用户隐私,这比基于服务器的方法更可取。

microsoft bing image creator

微软发布了一个名为bing图像生成器的新工具,使用户可以直接在microsoft edge中创建自己的图像。该公司发布了一套旨在激发创造力和自我表达的创作者工具。该工具允许用户制作个性化图像,以分享他们的生活更新或任何其他需要。

用户可以轻松从microsoft edge的侧边栏访问图像生成器。微软已采取积极措施,确保该工具的负责任使用,不促进冒犯性内容的传播。

该公司制定了一项内容政策,禁止在某些情况下使用图像生成器,并且用户可以报告任何违反此政策的行为。此外,微软还实施了技术来处理生成图像技术可能产生的潜在偏见。

在本文中,我们将评估每个描述性ai图像生成器在接收相同文本提示时的结果。

提示1:现代圣诞老人乘坐驯鹿在温暖明亮的阳光下行驶在高速公路上

midjourney
稳定扩散
bing图像生成器

提示2:近距离拍摄一只有大眼睛的动物,捕捉其天真和可爱

midjourney
稳定扩散
bing图像生成器

提示3:一个人类宇航员降落在一个新星球上,并受到敌对外星人的欢迎,他们拿出自己的武器

midjourney
稳定扩散
bing图像生成器

提示4:现代抽象艺术的书封,以纽约市为背景,色彩鲜艳夺目

mijourney
稳定扩散
bing图像生成器

提示5:一个男人在两个盘子之间做决定-其中一个盘子上有比萨饼,另一个盘子上有一个芝士汉堡

midjourney
稳定扩散
bing图像生成器

提示6: 一位受伤的战士骑着马在雪山上,手持一把剑

midjourney
stable diffusion
bing 图片创建者

提示7: 一幅使用不同色调的抽象图像,展示水的流动和流动

midjourney
stable diffusion
bing 图片创建者

提示8: 一条河里有鲑鱼,后面是郁郁葱葱的绿树

midjourney
stable diffusion
bing 图片创建者

提示9: 一张桌子上有一杯水,一只手正将柠檬挤入其中

midjourney
stable diffusion
bing 图片创建者

提示10: 在沙漠的地平线上,从骑大象的人的视角来看

midjourney
stable diffusion
bing 图片创建者

提示11: 一片纸钞长在树上的森林,鸟儿由硬币制成

midjourney
stable diffusion
bing 图片创建者

提示12: 一碗拉面,卡通着色,夕阳下的照明效果,逼真

midjourney
stable diffusion
bing 图片创建者

提示13: 埃隆·马斯克贫穷失业

midjourney
稳定扩散
必应图像创作者

结论

经过对midjourney、稳定扩散和必应图像创作者的输出进行评估,可以明显看出没有明确的获胜者。

每个生成器以独特的方式解释提示,在必应图像创作者和midjourney的输出中发现了相似之处。稳定扩散在提示具有清晰描述时效果很好,但通常对文字的理解过于字面。尽管midjourney和必应图像创作者通常很成功,但有时会产生与提示不符的结果。

值得注意的是,必应图像创作者在生成任何具有侮辱性或煽动性的输出时会采取谨慎措施,并在提示创建一张穷困和失业的埃隆·马斯克的图像时发出警告。微软采取这样的保护措施值得赞扬。

与此同时,midjourney的神经网络专业知识生成了一张贫困和凄凉的埃隆·马斯克的图像。因此,可以得出结论,每个生成器都将迎合其各自的用户群。

您还可以探索最佳的ai图像生成器,在几秒钟内获得惊人的图像。

类似文章