如何与AI实现无缝协作?掌握提示的两种方式,让AI更懂你

Ethan Mollick 开智学堂

作者:Ethan Mollick 来源:One Useful Thing,开智学堂翻译

01 提示的两种方式

只要不断使用 AI,你自然会学会如何更好地使用它。通过频繁使用 AI,你可以逐渐摸索出它的优点和局限,最终成为将 AI 应用于自己领域的专家。

这也是我不喜欢在 AI 讨论中过度强调“提示”这个概念的原因之一:它让人觉得使用 AI 系统比实际情况更复杂、更神秘。其实,只要开始使用 AI,看看它能带你走向何方就好。

我不喜欢过度强调提示的另一个原因是,对于大多数人来说,过分关注提示只是暂时的。随着 AI 系统的不断进步,复杂提示的需求会逐渐减少,因为 AI 本身会越来越善于理解你的需求。

我最喜欢的例子是 AI 图像生成器。OpenAI 发布的图像生成器虽然它并不比其他图像生成器(例如 Midjourney 或 Adobe Firefly)强多少,但有一个重要的区别:你不再需要自己想提示语,而是可以直接和 AI 讨论你想要的艺术效果,AI 会自动为你生成提示。

比如,我可以直接对 AI 说:

Create a cool scene that looks like a still from a movie of a car chase with two muscle cars. Hyper realistic, please.

创建一个酷炫的场景,看起来像电影中的汽车追逐,有两辆肌肉车。尽量做得逼真一些。

图片

AI 提供的提示词是:

A hyperrealistic photo capturing an intense moment in a desert setting where two muscle cars are engaged in a car chase. The scene shows a bright blue Dodge Charger, with its V8 engine thunderously roaring, kicking up a cloud of dust as it races across a barren, sunbaked desert. Chasing it is a fiery orange Pontiac GTO, its driver determined and skilled, maneuvering expertly through the rough terrain. The background features towering red sandstone formations under a clear blue sky, adding a sense of wild, rugged adventure to the chase.

一张极为逼真的照片,捕捉了沙漠中两辆肌肉车激烈追逐的瞬间。画面中,一辆亮蓝色的 Dodge Charger,V8 引擎发出震耳欲聋的轰鸣声,在炽热的沙漠上飞驰,扬起滚滚尘土。紧追其后的是一辆火焰橙色的 Pontiac GTO,驾驶员技艺精湛,灵活操控着车辆穿越崎岖不平的地形。背景中,红色砂岩高耸入云,蓝天无一丝云彩,为这场追逐增添了狂野和冒险的气息。

你可以在图片下方看到 AI 写的这段详细的提示词。结果还不错,但仍未达到我的预期:我希望它能更加逼真一些。这看起来更像是一幅画,而不是电影中的真实场景。

图片

AI 自动生成的图像描述:

An ultra-hyperrealistic photo of a thrilling car chase in a cinematic setting. The scene captures a silver 1967 Ford Mustang Shelby GT500 and a deep green 1969 Pontiac Firebird racing side by side on a misty mountain road. The dense fog adds a mysterious, almost surreal quality, while the wet road reflects the cars’ sleek designs and the surrounding dense, dark green pine trees. The intensity and determination on the drivers’ faces are visible through their windshields, adding to the drama and realism of the scene.

一张超逼真的汽车追逐照片,仿佛电影中的场景。画面展示了银色的 1967 Ford Mustang Shelby GT500 和深绿色的 1969 Pontiac Firebird 并排在雾气弥漫的山路上竞速。浓雾为场景增添了一种神秘感,甚至有些超现实,而湿滑的路面反射出这两辆车流线型的设计,周围是茂密的深绿色松树林。透过挡风玻璃,驾驶员脸上紧张而专注的神情清晰可见,进一步增强了场景的戏剧性和真实感。

现在已经很接近了。不错,这个场景已经很棒了。你能保持相同的场景,只是把 Firebird 换成红色的吗?

图片

好了。(你看到的图像是 AI 第一次生成的结果,没有进行任何编辑。整个过程只花了一分钟。)

不过,如果我想用“传统方式”来生成图像呢?这种方式需要使用像 MidJourney 这样的工具来设计提示词。我从一个偶然看到的 Twitter 账号中学到了一些关于电影场景的提示词(这些提示词我自己很难想到),包括一系列关键词:Ultra Panavision 70、暖色调的 Eastman Kodak 胶片、原始风格。

之后,我反复生成图像,调整细节,修改提示词。虽然我从未完全得到我想要的图像,但从另一个角度看,生成的图像更像是电影中的真实镜头,尽管并不是我心中设想的那部电影。整个过程花了十分钟,但这是因为我对 MidJourney 已经很熟悉了。对于新手来说,可能需要更多的时间。

图片

提示词:

Ultra Panavision 70, Action scene on a forest road, two muscle car chase, at day time, a silver 1967 Ford Mustang Shelby GT500 and a red 1969 Pontiac Firebird, rainy road, shot on warm-toned Eastman Kodak film —style raw —ar 21:9 —c 10

Ultra Panavision 70,森林路上的动作场景,两辆肌肉车追逐,白天,一辆银色的 1967 Ford Mustang Shelby GT500 和一辆红色的 1969 Pontiac Firebird,雨天的道路,使用暖色调的 Eastman Kodak 胶片拍摄 —style raw —ar 21:9 —c 10

我认为这很好地反映了当前提示词生成的现状。一方面,正如你在 OpenAI 中看到的,我不需要任何专业技能来生成图像。我只需要告诉 AI 我想要什么,它就能生成。这种方式可以称为“对话式提示生成”(Conversational Prompting )。虽然目前生成的图像效果只有 MidJourney 的 80%,但随着技术的进步,它会越来越好。我不需要学习复杂的技能,只需要等待技术发展。

另一方面,通过精心设计提示词,我现在可以获得更好的效果。这需要花费大量的时间和精力来学习如何使用 MidJourney,并且需要反复调整提示词。虽然这样做的结果可能更符合我的预期,而且我可以掌控更多细节,生成的图像也可能更加独特,但我需要掌握提示词的设计技巧。

不过,一旦我找到一个有效的提示词,我也可以将它分享给别人,他们也能生成类似的结果。我们称这种提示词为“结构化提示词”(Structured Prompting )。它们就像 AI 程序一样,可以让其他人从你探索和学习的成果中受益。

对于大多数人来说,今天的对话式提示生成已经足够帮助他们完成工作了。对于某些应用场景,至少目前来说,结构化提示词仍然有其独特的价值。无论你使用哪种方法,你都应该尽量使用你能接触到的最先进的模型。

02 对话式提示

对于大多数人来说,只需与 AI 交谈,告诉它你想要什么就行了。即使你自己不确定具体需要什么,也可以跟 AI 说说你的大概想法,看看它会给出什么建议。

图片

作为一个聊天机器人,AI 的设计初衷正是为了这样的互动:你可以像和另一个人对话一样和 AI 交流。它就像一个乐于助人的研究生,虽然有些天真,但为了不让你失望,它甚至可能编造一些信息。当你以这种方式使用 AI 时,你会逐渐摸索出它的优势和局限,知道它什么时候比较可靠,什么时候可能会出错。

有一个能显著提升对话效果的技巧:提供更多背景信息。你可以把 AI 的知识想象成一个巨大的云(虽然这个比喻不完全准确,但很有帮助)。在云的某个角落,AI 只用莎士比亚的十四行诗来回答;在另一个角落,它像个抵押贷款经纪人一样回复;还有一个角落,它主要依赖高中数学公式。

默认情况下,AI 会从云的中心给出最常见的答案,也就是普通人最可能得到的回答。通过提供更多背景信息,你可以引导 AI 进入它知识库中更独特的部分,得到更符合你需求的答案。很多 AI 的高级用法都依赖于这种定制化的操作。

最简单的方法是先给 AI 设定一个身份(比如,你是一个友好且专业的老师,帮助学生理解复杂问题)。虽然这不会让它瞬间变成一个完全准确的老师,但会帮助它理解你想要什么样的回答和语气。你还可以通过其他方式提供背景信息,比如粘贴你正在处理的文本,或者你需要填写的表格,看看它会怎么回答。

图片我让 ChatGPT 来示范一下前面提到的这些技巧

对于大多数人来说,这样已经足够开始使用了,这也是我在与 AI 互动时最常用的方法。不要把事情搞得太复杂,只需和系统互动,看看结果如何。

不过,当你积累了一定经验后,可能会想要创建一些可以分享给他人的对话提示,这些提示可以结合你的专业知识。我们把这种方法称为结构化对话提示。虽然随着 AI 的发展,这种方法可能很快就会被淘汰,但目前它依然是一个很有用的工具,能够让你通过编码自己的知识来帮助他人更好地使用 AI。

03 结构化提示

结构化提示是一种方法,旨在将 AI 转变为能够执行特定任务的工具,这个任务可以重复执行,并且能够根据用户需求进行调整。由于 AI 并不总是为此目的设计的,因此需要通过不断地实验和调整,才能使提示在某种程度上保持一致性(在大语言模型中很难做到完全一致)。

首先,你需要设定一个明确的目标。例如,在我们关于 AI 和教学的研究中,我们希望 AI 执行一个“预演失败” (pre-mortem) 的练习,这是一种通过想象项目可能失败的方式来减少实际失败风险的练习。

执行“预演失败”有其特定的步骤,而当前一代的 AI 需要确保它能够按照正确的流程进行,而不是仅仅回应用户的聊天请求。这就是结构化提示发挥作用的地方。你可以在下面看到一个例子。

图片

这个提示由多个部分组成:

1)角色和目标。

与对话式方法类似,基于角色和目标的约束可以将 AI 的响应范围限制在一个更合适的范围内。角色的设定可以利用 AI 的自然语言理解能力,充分发挥其在特定角色下的对话能力。

2)逐步指令。

向 AI 提供清晰的指令是获得有效输出的关键。一个简单的原则是:如果不熟悉你要求的人也能理解这些指令,那么 AI 也更有可能理解。此外,指令的结构越清晰,越有可能获得实用的输出。

由于 AI 对某些领域的知识比其他领域更丰富,因此不要假设它对任何特定领域都有足够的了解。当你给 AI 下达指令时,应该简洁明了,使用简单直接的语言,避免使用模棱两可的词汇。你可以从目标或任务概述开始(解释任务的目的和你期望的结果),这有助于大语言模型更好地理解任务方向。

研究表明,给 AI 明确的逐步指令通常是最有效的方法。

一种称为“链式思维”(Chain of Thought)的提示方法是在发出请求之前,先给 AI 一个推理示例,但你也可以像我们在这个提示中所做的那样,逐步给出指令。如果指令包含多个部分,应清晰地标明这些部分(首先提出我在撰写商业计划书时应该考虑的几种策略。接着,解释每种策略,并结合我的业务,说明如何发展这些策略)。

如果你面对的是复杂或多步骤的问题,可以将问题拆解成多个步骤,并要求 AI “逐步思考”。与 AI 的任何交互(尤其是复杂交互)一样,检查并评估每个步骤:AI 是否按照预期进行?它是否遵循并记住了你的指令?如果没有,你可以调整你的方法。

3)专业知识(在上述案例中为“教学法”)。

结构化提示中最核心的部分是你对 AI 应该如何在提示中表现的理解和观点。在这里,我们有一个关于 AI 如何与学生互动的教学愿景,目的是通过提问引导学生思考潜在的失败点,而不是直接给出答案。你需要明确你希望 AI 做什么,以及它的行为与默认行为有何不同。

4)约束条件。

提示中的约束条件是指导 AI 与用户交互时的规则或条件。例如,当被要求扮演导师角色时,AI 通常会同时扮演导师和学生。如果提示的目标是帮助学生学习某个概念,那么限制 AI “在继续之前等待学生回应”有助于引导 AI 的互动。

约束条件还能让 AI 的行为更加可预测。例如,如果给 AI 一系列问题并告诉它“每次只问一个问题”,这个约束可以让对话更加互动和有条理。

额外的约束条件还可以限制 AI 的响应长度,避免让用户感到负担过重,或者限制来回交流的次数,防止 AI 陷入循环或失去对话的连贯性。

你还可以定义 AI 何时以及如何发起对话。例如,“始终等待用户开始对话”或“始终以自我介绍开始对话,例如‘我是 AI 教练,来帮助团队进行事后审查’。”

5)个性化

通过提示向用户收集信息可以特别有帮助。你可以让 AI 提问来帮助解决问题。因为 AI 只能“知道”它所获得的上下文,通过一系列问题与它互动,可以为 AI 提供更多背景信息,从而更好地帮助你。

在结构化提示中,设计 AI 作为引导者角色,向你提问是通用提示设计的一部分——这有助于个性化互动,使 AI 能够适应不同的场景。

其他可能有帮助的内容:

1)示例和少样本 。

少样本学习(Few-shot learning)是指给模型提供少量示例(或“样本”),帮助它在新任务中进行推理。这与零样本学习(Zero-shot learning)不同,后者不给模型任何示例,而是要求它自行推理。

在少样本提示中,模型会收到几个示例,展示你希望 AI 生成的内容、写作风格或决策类型。通过结合抽象指令和具体示例,AI 能更好地适应和响应。虽然我们在当前提示中没有使用这种方法,但你可以尝试在自己的提示中加入示例。

2)请求特定输出。

鉴于模型的强大能力,你可以请求多种形式的输出。例如,你可以要求生成图片、解释、图表、表格、文档、Excel 电子表格,甚至是一个网站。尝试不同的请求方式,可能会带来意想不到的结果。

3)情感诉求。

我对这个问题还没有完全确定的看法,但一项研究表明,当在请求中加入情感诉求时,大语言模型(LLMs)在多个维度上的输出质量提高了近 10%。

在研究中,他们只是简单地在请求末尾添加了一些情感短语,如“这对我的职业生涯非常重要”,“你最好确定”,“为你的工作感到自豪,尽你最大的努力。你对卓越的追求让你与众不同”和“你确定这是最终答案吗?相信自己的能力,追求卓越。你的努力将带来丰硕的成果”。

不同的情感短语在不同情境下效果不同,虽然没有一个万能的短语,但与职业相关的表达通常效果不错。尽管给出这种建议让我有些犹豫,但你或许可以在提示的末尾加上类似的内容。目前研究还无法解释为什么这种方法有效。有时 AI 的行为确实出人意料。

作为最后一步,你需要通过实际操作来检查提示的效果,提供各种类型的输入,包括好的、坏的和中立的。

站在用户的角度思考——AI 是否真的有帮助?这个流程是否有效?AI 如何变得更有帮助?它是否需要更多的上下文?是否需要进一步的限制条件?你可以不断调整提示,直到它满足你的需求,并且你认为它对你的受众也有效。然后分享它并收集反馈。

对我来说,分享是结构化提示最有趣的部分。它允许任何人将你学到的东西应用到他们自己的场景中。例如,Microsoft 已经收集了一些我们在教育领域的提示,你可以自由地基于这些提示进行构建或实验(我们并未从 Microsoft 或其他 AI 公司获得任何报酬)。我们希望其他人也能开始分享他们的结构化提示。

04 从哪里开始

最简单的使用 AI 的方法就是把它应用到你每天的日常任务中。如果你在写邮件,可以让 AI 帮你写,然后通过对话的方式让它改进。如果你在构思点子,可以向 AI 寻求帮助。如果你在做决策,可以把数据交给 AI,听听它的建议。刚开始时,不用太过较真,毕竟你还在了解它的能力。不过,经过大约 10 个小时的使用后,你会逐渐明白 AI 能为你做些什么。

请记住,尝试将 AI 应用到你日常工作中的成本非常低,而其他人要弄清楚如何帮助你高效使用 AI 则要困难得多。这有两个重要的启示。

首先,没有人能完全帮你找到最适合你的使用方法,也没有专门为你设计的操作手册,你需要自己摸索。其次,你有机会成为使用 AI 来提升工作效率的专家,这将为你带来巨大的竞争优势。

当你准备好了,你可以通过“结构化提示”来与他人分享你的经验。不过,随着 AI 的不断进步,结构化提示可能只是个过渡阶段。未来,AI 将越来越多地主动为我们提供帮助,而不是等待我们去命令它。■