2. 推理模型
推理模型指的是 DeepSeek-R1,对应 DeepSeek 网页端的「深度思考」模式与 V4 系列的「思考模式」(Thinking Mode)。R1 在生成最终答案之前,会先输出一段思维链(Chain-of-Thought),完成问题拆解、假设推演、自我检验之后再给出结论。这一机制让它在数学、逻辑、复杂代码、多步规划、严谨论证等任务上表现远超非推理模型,但同时也意味着——R1 的提示词写法,与 V4 非推理模型截然不同。
很多用户把 V4 的提示词直接套用到 R1 上,结果反而拿不到好答案。原因在于:非推理模型需要提示词替它"想清楚",而 R1 会自己想清楚,过度结构化的提示词反而会束缚它的推理路径。理解这一点,是写好 R1 提示词的前提。
下面分别介绍 R1 提示词的核心原则、典型写法、常见陷阱,以及不同任务场景下的实战模板。
推理与非推理模型的提示词差异
在动手写提示词之前,需要先理解两类模型的本质差异。这一差异直接决定了提示词写作策略的不同。
简单概括:对 V4 要"喂得细",对 R1 要"问得准"。
提示:这一节的所有建议,主要面向"问问题"和"做任务"的常规使用场景。如果你在做复杂的 Agent 工作流编排(例如让 R1 在多步工具调用中担任决策节点),仍然需要相对详细的指令——这不属于本节讨论范围。
R1 提示词的核心原则
原则一:聚焦"问什么",不要纠缠"怎么想"
R1 的强项在于自主推理。提示词的任务是把问题说清楚,而不是替它规划推理步骤。下面是一组对比:
不推荐写法(过度引导推理过程):
推荐写法(直接陈述问题):
R1 在思维链中会自动完成"理解—列条件—推导—计算—验证"的全过程,提示词里再写一遍反而会让模型机械地填表,损失推理灵活性。
原则二:避免冗余的"思维链触发语"
诸如「让我们一步一步思考」(Let's think step by step)、「请仔细推理」「请深度思考」这类在 GPT-4 时代非常有效的 CoT 触发语,对 R1 几乎没有正向作用,有时反而会让模型重复表达"思考"这件事本身,浪费 token 预算。
R1 默认就会进行链式推理,不需要人为唤醒。
原则三:示例(few-shot)通常不必要
对于非推理模型,给出 1 至 3 个输入输出示例(few-shot prompting)是提升输出质量的常用技巧。但对 R1 而言,已有研究与社区实践都表明:zero-shot 通常优于 few-shot。
原因在于,R1 会基于示例反向推断"任务隐含的解题模板",而这个模板未必是最优的。直接陈述问题,让 R1 自己设计解题路径,效果往往更好。仅在以下两种情况下建议给示例:
- 输出格式高度特殊,必须严格匹配某个模板(如生成符合特定 Schema 的 JSON)
- 任务本身有约定俗成但模型未必知晓的领域规范(如某个行业的特殊表格写法)
原则四:角色设定要克制
V4 时代盛行的"你是一位拥有十年经验的资深 XX 专家"开场白,对 R1 的增益有限。R1 已经具备很强的领域知识,强行加角色容易让它的语气偏向角色扮演而非分析。
如果确实需要某种专业视角,建议在任务描述中带出来,而不是单独立一段角色设定。例如:
不推荐:
推荐:
原则五:约束在结尾,目标在开头
R1 的提示词建议遵循"开头点明任务,结尾交代约束"的结构。开头让模型立刻锁定问题本质,结尾的格式与字数要求则不会干扰其推理过程。
中间不要塞入与推理无关的修饰语,例如"这个问题对我很重要""请认真对待"等,这类话术对 R1 几乎无效。
R1 提示词的基础结构
综合上述原则,R1 提示词的推荐结构非常简洁:
注意三个部分都不需要硬性的标签,自然语言陈述即可。R1 不依赖结构化标记来理解任务。
一个最小化的示例
这条提示词没有角色设定、没有思维链触发、没有示例,但 R1 会自动完成约束建模、求解、验证、汇总的全流程。
不同任务场景提示词写法
场景一:数学与逻辑推理
这类任务是 R1 的主场。提示词的关键是把题目说完整、说精确,避免歧义。
写作要点:
- 数值、单位、约束条件全部写清楚,不要让模型猜
- 如果有多种合理解读,提前指定一种
- 复杂题目可以要求"分别给出每一步的依据"
示例:
场景二:复杂代码分析与调试
R1 在代码任务上的优势在于能够"读懂"代码意图、识别隐藏 bug、推断异常根因。提示词需要做的是提供完整上下文,包括代码、报错信息、运行环境与预期行为。
写作要点:
- 粘贴完整代码,不要只给片段(除非问题明确局限于片段)
- 报错信息要原样粘贴,包括 traceback 全文
- 明确说明"代码做了什么"与"期望做什么"两者的差距
- 指明运行环境(Python 版本、关键库版本、操作系统)
示例:
场景三:多步骤决策与方案分析
涉及商业决策、产品规划、战略选择的任务,R1 的优势在于能够同时考虑多重约束并给出权衡分析。提示词的关键是把所有约束与偏好交代清楚。
写作要点:
- 列出所有已知条件:预算、时间、资源、市场环境等
- 说明决策者的核心偏好(更看重速度还是稳健、更看重规模还是利润)
- 明确希望得到"单一推荐"还是"多方案对比"
- 如果有禁选项(已经排除的方案),也要说明
示例:
场景四:学术分析与论证写作
R1 在论证类任务上能够生成结构严谨、引证清晰的内容。提示词需要交代论题、立场、读者、深度这四个要素。
写作要点:
- 论题尽量收窄,不要写"分析人工智能的影响"这种过宽的题目
- 如果对立场有要求(支持、反对、中立),明确指出
- 说明目标读者的专业背景,决定术语深度
- 指定大致字数与结构,避免输出失控
示例:
场景五:信息抽取与归纳
虽然 R1 比较"重",但对于复杂的信息抽取任务(涉及推断、消歧、跨段落关联),R1 的输出准确率往往明显高于 V4。
写作要点:
- 明确说明要抽取哪些字段
- 对模糊字段给出判断规则(例如"金额"是否包含税费)
- 指定输出格式,最好直接给出空白模板
- 对"找不到"的情况说明如何处理(留空、写"未提及"、还是给出推断)
示例:
R1 提示词的常见陷阱
以下几种写法在 R1 上效果不佳,建议避免:
陷阱一:堆砌"思考触发词"
这类词对 R1 没有增益,且会占用 token。R1 默认就在深度思考。
陷阱二:要求模型"先列大纲再写正文"
对非推理模型这是好习惯,对 R1 则没有必要。R1 在思维链中已经完成了大纲规划,再要求一次会让最终答案与思维链高度重复。
陷阱三:把推理过程写进输出格式要求
R1 的思维链已经在灰色推理区域单独展示,再要求把它复制到答案里既冗余又会让正式答案变得啰嗦。思维链的归思维链,正式答案的归正式答案。
陷阱四:用大量"激励性话术"
R1 对这类话术不敏感,写了也是无效输入。问题本身的清晰度才是决定输出质量的关键。
陷阱五:在简单问题上启用 R1
R1 单次响应通常需要 30 秒至数分钟,且消耗资源更多。问"今天星期几""帮我把这段话改通顺"这类任务,用 V4 快速模式即可,启用深度思考反而是对资源的浪费。
提示: 一个简单的判断标准是——如果你能在 10 秒内口头说出答案大致方向,那这个问题不需要 R1;如果你需要在纸上画一画、算一算才能回答,R1 就有用武之地。
进阶技巧:延长思考时间
在 DeepSeek 网页端,R1 偶尔会因为服务器负载等原因主动缩短思考时间,导致输出深度不够。如果遇到这种情况,可以在提示词末尾追加以下任意一句来引导更充分的推理:
这类提示能将思考时间从默认的几秒延长至一分钟以上,特别适合用于:
- 复杂的商业决策分析
- 需要识别多重风险的方案评估
- 容易陷入定式思维的创意类任务
- 高风险论断(医疗、法律、财务)的反向验证
注意: 这类技巧不应作为常规写法滥用。对于本身简单的问题强行延长思考,反而会让 R1 在冗长的自我对话中偏离主题。建议仅在你认为标准 R1 输出不够深入时再启用。
进阶示例:商业决策的反向审视

评论
0 条