给张图就能反推 Prompt，AI 绘画神器能够「看图说话」了，会比人类手写的更好吗？-萌图百科圈子

Lv.3

在各种 AIGC 产品层出不穷的今天，让 AI 画一张图已经不是什么难事。尽管有着「无需动笔」、「零门槛作画」等一系列优点，但很多人并不能借助 AI 之手轻松获得一幅理想中的作品 —— 难点在于「prompt」。 Prompt 方法是一门极深的管理学问：如果不输入精准的命令描述，生成结果就可能十分随机，甚至与预期相去甚远。但归根结底，如何给出完美的 prompt，如何让模型按照人类用户预设的方式输出结果，甚至如何降低花在 prompt 上的成本，很少有人清楚。正因此，AIGC 产业衍生出了一种专门的职业 ——prompt 工程师。前段时间，初创公司 Anthropic 在旧金山招聘「prompt 工程师和图书馆员」，给出的薪水高达 33.5 万美元。或许，这一过程也能让 AI 代劳呢？AI 会做的比人类更好吗？最近，AI 绘画神器 Midjourney 就上新了一个功能：/describe。「今天，我们发布了一个 /describe 命令，可让您将图像转换为文字。」具体来说，Midjourney 学会了从图像中反推 prompt。如果你在 Midjourney 上传一张图片，它会提供给四个版本的描述，你可以直接拿来并进行调整，然后去生成自己想要的图片变体。 Midjourney 是一款 2022 年 3 月发布的 AI 绘画工具，此前刚刚推出第五代版本，由于生成效果十分「炸裂，大量用户迅速涌入，以至于该公司不得不关闭了免费注册通道。这一次功能的更新意义重大：改进可访问性：通过用于 Web 显示的 ALT 文本元素，图像描述让有视觉障碍或阅读困难的人更容易访问数字内容；增强的可搜索性：描述可以通过搜索引擎启用更好的搜索功能和索引；用于标题：可以包含描述，使图像更加清晰；详细 prompt：描述可用于创建更详细的 prompt 以制作新变体，可以为快速工程提供灵感。怎么使用？用户只需从写一个「 /describe」开始，Midjourney 提供了上传图像的位置：上传图片后，点击进入：然后，Midjourney 根据图像返回四个描述：底部的四个数字是混合按钮，每个数字都与相应的描述相匹配。单击数字，Midjourney 会根据新的描述重新混合图像。AI绘画神器Midjourney能够“看图说话”了_澎湃号·湃客_澎湃新闻-The Paper

给张图就能反推 Prompt，AI 绘画神器能够「看图说话」了，会比人类手写的更好吗？

你可能想认识

动态墙

随机推荐

如何屏蔽本站广告？点我查看教程