# AI绘画工具Midjourney创始人：AI绘画技术是想象力的发动机

By [dwww](https://paragraph.com/@dwww) · 2022-08-15

---

原标题：《AI绘画工具Midjourney创始人：人工智能像水》

汽车比人的速度快，但并不意味着我们不再行走。远距离移动大量物体时，我们需要发动机，无论是飞机、船只还是汽车。我们认为AI绘画技术是想象力的发动机。”

“人们完全误解了人工智能是什么。他们把它看作是一只老虎。老虎很危险，可能会吃掉我，是一个对手。水也有危险，你会淹死在水中，但你也可以在里面游泳，可以制造船只，可以用水坝发电。水是危险的，但它也是文明的驱动力。”

AI绘画会让艺术家们集体失业吗？

Midjourney是一款AI绘画工具，只要输入你想到的文字，就能通过人工智能产出相对应的图片，耗时只有大约一分钟。自今年5月推出beta版后，这款搭载在Discord社区上的工具迅速成为讨论焦点。

今年4月，另外一款大热的AI绘画工具DALL-E升级到第二代，并在7月对100万个用户开放测试，尽管要收费，还是吸引了大量用户涌入。

目前，AI生成的艺术品正悄悄开始重塑文化。过去几年里，机器学习系统从文本提示生成图像的能力，在质量、准确性和表达能力方面都得到了显著提高。这些画作在互联网上流传，给人们带来了一种新奇感。艺术家和设计师也正在把这些软件集成到工作流程中，很快，由人工智能生成和增强的艺术将无处不在。

但是，这些工具从实验室转移到日常用户手中，在创造新的视觉表达语言的同时，也很可能带来新的问题，比如版权纠纷、输出错误信息的潜在危险，都必须引起注意。

近日，科技媒体The Verge专访了Midjourney的创始人David Holz。这家公司目前只有约10个员工，但雄心勃勃。Holz说：人工智能增强下创造力的涌现，仍然只是冰山一角。

**以下为采访内容，有删减。**

\*\*问：\*\*你有什么背景？是怎么进入这个领域的？什么是Midjourney——一家公司，一个社区？如何描述它？

\*\*答：\*\*我2011年左右搬到旧金山，创办了名为Leap Motion的科技公司，运营12年后离开，再创办了Midjourney。

我们认为，（AI绘画工具）不是关于艺术或深度伪造（deepfake）的问题，而是，我们如何扩大人类物种的想象力？当计算机比99%的人类更擅长视觉想象力时，这意味着什么？这并不意味着我们将停止想象。汽车比人的速度快，但并不意味着我们不再行走。远距离移动大量物体时，我们需要发动机，无论是飞机、船只还是汽车。我们认为这项技术是想象力的发动机。因此，这是一件非常积极和人性化的事情。

\*\*问：\*\*许多实验室和公司正在开发类似的技术，将文本转化为图像。谷歌有Imagen，OpenAI有DALL-E，还有一些较小的项目，如Craiyon。这种技术从何而来，你觉得它未来会走向何处？Midjourney的愿景与这个领域的其他人有什么不同？

**答：**（人工智能带来图像生成工具）取得了两个突破。一个是理解语言，另一个是创建图像的能力，结合后可以通过理解语言来创建图像。这些工具将比人类更擅长制作图像，而且速度会非常快，在未来一两年内将能够实时制作内容：每秒30帧，高分辨率。会很贵，但是是可能实现的。然后在10年后，将能买到带有巨型人工智能处理器的Xbox，所有游戏都像梦一样。

我们去年9月开始测试原始技术，很快发现，大多数人不知道他们想要什么。你说：“这里有一台机器，你可以用它画任何东西，你想要什么？”他们说：“狗”。你说：“真的吗？”然后他们说：“粉红色的狗”。所以你给他们一张狗的图片，他们就说“好吧”，然后去做别的事情。

然而，如果你把他们放在一个小组里，他们会说“狗”，其他人会说“太空狗”，还有人会说“阿兹特克太空狗”，然后突然之间，人们明白了这些可能性，你正在创造一种被增强的想象力，一个可以用这种新能力学习和娱乐的环境。因此，我们发现人们真的喜欢一起想象，所以我们让（Midjourney）更具社交性。我们有一个巨大的Discord社区，大约有100万人在这些共享空间中共同想象。

\*\*问：\*\*你认为这种人类的集体与机器的集体是平行的吗？可以作为这些人工智能系统的某种制衡？

\*\*答：\*\*不存在机器的集体。每次你要求人工智能作画时，它都不记得或知道它做过的任何东西。它没有意志，没有目标，没有意图，没有讲故事的能力。所有的自我、意志和故事都是我们人类的。它就像一个发动机，发动机不会自己去哪，但人会去。

社区内有一百万人在制作图像，你必须支付额外费用才能退出社区——如果这么做，说明你是某种类型的商业用户。所以每个人都在互相撕裂，产生新的美学。几乎就像审美加速主义。它们不是人工智能美学，而是新的、有趣的人类美学，我认为它们会溢出到真实世界。

一个由百万人组成的社区，他们的想象力被人工智能增强了。（图 The Verge / Midjourneynone）

\*\*问：\*\*这种开放性能确保安全吗？因为有很多讨论，说人工智能图像生成器被用来生成潜在的有害内容，无论是令人讨厌的图像——血腥和暴力——还是错误信息。你如何阻止这种情况发生？

\*\*答：\*\*当你在某人制作的所有图像上写上他的名字时，他们在使用方面就更加有规范了。这很有帮助。

每当我们看到时都会禁止。如果必须的话，会禁言。

\*\*问：\*\*那真实的面孔呢，因为这是制造错误信息的另一个载体。模型是否生成逼真的面孔？

\*\*答：\*\*会产生名人面孔这类东西。但我们一般不会，我们有默认的风格和外观，既具有艺术性又美观。如果花100个小时尝试，也许可以找到一些合适的单词组合，让它看起来非常逼真，但你必须非常努力，让它看起来像一张照片。就我个人而言，我认为世界不需要更多的深度伪造，但它确实需要更多美丽的东西，所以我们专注于让一切看起来美丽和具有艺术性。

---

*Originally published on [dwww](https://paragraph.com/@dwww/ai-midjourney-ai)*