写好提示词prompt(一)了解提示词的常用写法与适用场景

Wait 5 sec.

在当今信息爆炸的时代,高效地使用提示词(prompt)已成为各行各业提升工作效率的关键之一。然而,提示词的写法和适用场景却常常让人困惑。本文将深入探讨提示词的常用写法,并通过实际案例展示其在不同场景下的应用。Google发布的最新框架CRISPECR:Capacity and Role(能力与角色)。你希望 ChatGPT 扮演怎样的角色。I: Insight(洞察),背景信息和上下文。S:(陈述),你希望 ChatGPT 做什么。P:Personality(个性),你希望 ChatGPT 以什么风格或方式回答你。E:Experiment(实验),要求 ChatGPT 为你提供多个答案。常见的prompt的写法:Zero-shot、Few-shot、CoT、CoT+SC、Step-BackZero-shot(零样本学习):是一种机器学习技术,要求模型在没有见过任何特定任务的训练样本的情况下,仅根据任务的描述和自身已有的知识来完成任务。模型需要依靠其在预训练阶段学习到的通用知识和模式识别能力,对全新的、未见过的任务进行推理和预测。例如在图像分类中,模型在训练时未见过某种特定类型的图片,在测试时却要对该类图片进行分类;或者在语言翻译中,直接让模型翻译从未见过的句子,仅通过任务指令来驱动模型输出结果。Few-shot(少样本学习):与 Zero-shot 相对,模型在进行预测任务时,只需要少量的样本作为参考。通常情况下,模型在预训练阶段学习了大量的通用知识,然后在面对新的具体任务时,仅利用很少的几个标注样本对模型进行微调或引导,使其适应新任务。例如在文本分类任务中,可能只给模型提供几个属于某一类别的文本示例,模型就能根据这些少量样本以及预训练的知识来对新的文本进行分类,判断其是否属于该类别。CoT(Chain of Thought,思维链):是一种提示技术,旨在引导语言模型生成一系列中间推理步骤,以帮助其更好地回答复杂问题。通过在输入中提供一些示例,展示问题解决的步骤和逻辑链条,让模型学习模仿这种推理方式,从而提高模型在复杂任务上的性能。例如在数学问题求解中,给模型提供 “2+3=?首先计算 2+3,得到结果 5” 这样带推理步骤的示例,模型就能学会按照这样的思维链来解决其他数学问题,而不是直接给出答案。CoT+SC(Chain of Thought + Self-Consistency,思维链 + 自洽性):是在 CoT 基础上的进一步扩展。在使用思维链引导模型生成推理路径后,通过从模型中采样多个不同的推理路径,并选择其中最一致或最合理的结果作为最终答案,来提高模型回答的准确性和可靠性。例如对于一个复杂的逻辑问题,模型可能生成多条不同的推理链,通过比较这些推理链之间的一致性和合理性,选择出最优的结果,避免模型只依赖单一的推理路径而可能出现的错误。Step-Back:可以理解为一种在解决问题或进行推理时退后一步、从更宏观或更基础的角度去思考的策略。在模型应用中,可能是指让模型暂时跳出当前具体问题的细节,回顾一些基本概念、原理或更广泛的知识,以便更好地理解问题和找到解决方案。比如在处理一个复杂的科学问题时,模型先回顾相关的科学定律和基础知识,再基于这些进行具体问题的分析和解答,而不是直接从问题的表面入手。当然5种不同的提示词写法应当应用在不同的场景下:一、无提示词Zero-shot(一)常识推理领域任务:如果一个人在月球上跳跃,会比在地球上跳得更高还是更低?Zero-shot 方式:向模型提问 “一个人在月球上跳跃和在地球上跳跃,哪里跳得更高”,模型依据对地球和月球重力等常识的理解来回答,正常情况下会输出 “在月球上跳得更高”,不需要提前给它关于在月球和地球跳跃对比的具体例子。(二)情感分析领域任务:分析 “这部电影真的太精彩了,我从头到尾都被吸引住了” 的情感倾向。Zero-shot 方式:输入 “请分析‘这部电影真的太精彩了,我从头到尾都被吸引住了’表达的是积极情感还是消极情感”,模型根据语句中的词汇和语义来判断并输出 “积极情感”,无需事先用大量标注好情感倾向的影评来训练它针对这句话的判断。(三)文本分类领域任务:判断 “今天的天气真好,阳光明媚,适合出门游玩” 属于什么类型的文本。Zero-shot 方式:给模型输入 “请判断‘今天的天气真好,阳光明媚,适合出门游玩’属于以下哪种文本类型:新闻、日记、诗歌、散文”,模型根据对各种文本类型的理解和句子内容进行判断,可能输出 “日记倾向的日常记录文本” 等答案,而不需要事先给它提供大量已标注好类型的类似文本作为示例。拓展:对于更复杂的文本分类,如判断一段关于人工智能技术原理的描述属于科普文本、学术论文摘要还是技术博客,也可通过 Zero-shot 让模型进行判断。二、Few-shot(少样本学习)(一)文本生成给模型提供几个特定风格的文本片段,如提供几句古风诗词,然后要求模型以同样的古风风格创作一首完整的诗。模型根据这几个样本学习古风诗词的用词、韵律、句式等特点,生成新的内容。(二)命名实体识别只给模型提供少量标注好的包含人名、地名、组织名等实体的句子,例如 “小明去了北京的清华大学” 标注出 “小明” 是人名,“北京” 是地名,“清华大学” 是组织名,让模型据此识别其他文本中的各种命名实体。(三)语义角色标注给出少量已经标注好语义角色的句子,如 “小明 [施事] 把书 [受事] 放在桌子上 [地点]”,让模型学习不同语义角色的特点和关系,然后对新的句子进行语义角色标注。三、CoT(Chain of Thought,思维链)(一)数学领域简单算术问题:问题为 “小明有 5 个苹果,小红的苹果比小明多 3 个,请问小红有几个苹果?” 思维链可以是 “首先,已知小明有 5 个苹果,小红比小明多 3 个。那么我们要做的就是在小明的苹果数基础上加上多出的数量,即 5 + 3 = 8。所以,小红有 8 个苹果。”几何问题:“一个三角形的底边长为 6 厘米,高为 4 厘米,求它的面积。” 思维链可以是 “首先,我们知道三角形的面积公式是 S = 1/2× 底 × 高。题目中给出底边长为 6 厘米,高为 4 厘米。那么将数值代入公式可得,S = 1/2×6×4 = 3×4 = 12 平方厘米。所以这个三角形的面积是 12 平方厘米。”(二)逻辑推理领域真假判断问题:“有三个人,A 说 B 在说谎,B 说 C 在说谎,C 说 A 和 B 都在说谎,请问谁说的是真话?” 思维链可以是 “假设 A 说的是真话,那么 B 在说谎。因为 B 说 C 在说谎,所以 C 说的是真话,可 C 说 A 和 B 都在说谎,这与假设 A 说真话矛盾,所以 A 说的是假话。假设 B 说的是真话,那么 C 在说谎,C 说 A 和 B 都在说谎就是假的,即 A 和 B 至少有一个说的是真话,因为假设 B 说真话,A 说假话是符合的,所以该假设成立,B 说的是真话。假设 C 说的是真话,那么 A 和 B 都在说谎,可 A 说 B 在说谎就成了真话,这与 C 说的话矛盾,所以 C 说的是假话。综上,B 说的是真话。”(三)排序问题“小明、小红和小李参加跑步比赛,小明比小红跑得快,小李比小明跑得慢,请问三人的名次顺序是怎样的?” 思维链可以是 “首先,根据小明比小红跑得快,可知小明的名次在小红前面。又因为小李比小明跑得慢,所以小明的名次也在小李前面。那么三人的名次顺序就是小明第一,然后小李在小明之后,所以小李第二,最后小红第三。”任务:分析 “这部电影真的太精彩了,我从头到尾都被吸引住了” 的情感倾向。Zero-shot 方式:输入 “请分析‘这部电影真的太精彩了,我从头到尾都被吸引住了’表达的是积极情感还是消极情感”,模型根据语句中的词汇和语义来判断并输出 “积极情感”,无需事先用大量标注好情感倾向的影评来训练它针对这句话的判断。四、CoT+SC(Chain of Thought + Self-Consistency,思维链 + 自洽性)(一)医学诊断与治疗方案设计任务:根据患者症状、检查结果和病史,制定治疗方案。CoT+SC方式:1 基于指南推荐的标准流程推导。2 参考类似病例的成功治疗方案。3 考虑患者过敏史和药物相互作用。(二)法律咨询与合同审查任务:分析合同条款是否存在法律风险或歧义。CoT+SC方式:1 从合同法角度解析条款合法性。2 对比行业标准合同模板的差异。3 模拟不同履约场景下的责任划分。这类场景还有很多,COT 指示通过分步骤加大了 LLM 的深度。 SC 则是在增加深度的基础上再增加宽度。五、Step-Back(一)工作项目问题任务:当前项目延期的原因是什么Step-Back方式:1. 要想得到项目延期的真实原因,你需要知道哪些前提问题2. 这些前提问题的答案分别是什么3. 基于这个前提问题,你的结论是什么(二)生活问题任务:怎么解决我们的家庭装修中空间布局不合理的问题Step-Back方式:1. 要想得到项目延期的真实原因,你需要知道哪些前提问题2. 这些前提问题的答案分别是什么3. 基于这个前提问题,你的结论是什么五、总结对于同样的模型,同样的任务,使用不同的 Prompt,输出的结果也有不小的差异一般来说,使用Prompt技巧的结果 回比不使用任何技巧要好对于简单的任务并不是叠加所有的技巧就会更好,到达一定结果后。再叠加技巧不会提升效果这是一个让大家理解 Prompt 编写技巧的小教程,所以采用了同一个任务方便对比,但是有些复杂技巧适合与更难的任务,只有在更难的任务上才能看出差异本文由 @AAA有生之年 原创发布于人人都是产品经理。未经作者许可,禁止转载题图来自Unsplash,基于CC0协议该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务