1. 非推理模型


非推理模型指的是 DeepSeek-V4 在「快速模式」下的工作方式,对应 API 中的 deepseek-v4-prodeepseek-v4-flash 非思考模式(Non-Thinking Mode)。在这种模式下,模型不会进行显式的链式推理,而是直接根据提示词生成最终答案,响应速度快、调用成本低,适合日常对话、内容创作、信息抽取、批量任务等场景。

正因为非推理模型不会"边想边写",提示词的结构化程度就成了决定输出质量的关键变量。同样一个需求,写得越清晰、约束越明确,模型的输出就越稳定可用。业界目前形成了两套较为成熟的结构化提示词框架:CO-STAR 框架BROKE 框架。前者偏向内容创作与沟通表达,后者偏向工程化任务与可验证产出。

下面分别介绍两套框架的构成、写法要点与完整示例。

CO-STAR 框架

CO-STAR 由新加坡政府科技局在 2023 年的一场提示工程竞赛中提出并推广,强调对沟通要素的精细刻画。它由六个要素组成:

要素英文全称含义写作要点
CContext(上下文)任务发生的背景与已知信息补充模型无法从任务描述中推断出的背景信息,例如行业属性、项目背景、关键事实、已知约束等。一条经验法则是,把刚入职的同事拿到这个任务时会问的问题,提前在 Context 里回答清楚。
OObjective(目标)希望模型完成的具体任务用动词开头,明确说明"做什么"。避免"帮我处理一下""优化一下"这类含糊动词,使用"撰写""归纳为五条要点""按时间顺序排列""提取所有人名"等可以验证的动作。
SStyle(风格)文本的形式特征与写作风格描述文本的形式特征,例如学术论文风格、新闻特写风格、产品发布稿风格、技术文档风格等。可以通过指定参考对象来锚定风格,例如"参考《经济学人》的商业报道写法"。
TTone(语气)文本传达的情感基调描述情感与态度,与 Style 互为补充。常见语气有正式、亲切、克制、幽默、共情、激励等。Style 决定"怎么写",Tone 决定"带着什么情绪写"。
AAudience(受众)输出内容面向的读者决定术语密度、解释深度与文化参照。同样是介绍一项技术,面向研究生和面向高中生应该是两种完全不同的输出。
RResponse(响应格式)期望的输出结构、格式、长度包括输出的结构(Markdown、JSON、表格、纯文本)、长度(字数或段落数)、必备小节、是否包含示例、是否需要引用来源等。

使用技巧:

  • 六个要素不必每条都写满,根据任务取舍,但 Context、Objective、Response 三项建议必填
  • Style 和 Tone 容易混淆,可以先写 Style 锁定形式,再用 Tone 微调情绪
  • Audience 一栏越具体越好,"中型企业 IT 负责人"比"企业用户"更有效
  • Response 中的格式要求,建议直接给出小节标题或字段名,不要让模型猜

完整示例:撰写企业产品发布稿

提示词:

# Context(上下文)
我们是一家成立四年的企业级数据分析 SaaS 公司,主要客户为零售、制造业的中型
企业(年营收 5 亿至 50 亿元人民币)。本次发布的是 v3.0 版本,核心更新有三点:
(1)引入自然语言查询能力,业务人员可直接用中文提问获得数据可视化结果;
(2)查询响应时间相比 v2.0 降低 60%;
(3)新增与主流 ERP 系统的预置连接器(用友、金蝶、SAP B1)。
当前市场环境:同类产品普遍仍依赖拖拽式 BI 操作,自然语言查询是差异化卖点。

# Objective(目标)
撰写一篇用于公司官网与微信公众号同步发布的产品发布稿,介绍 v3.0 的三大更新,
并引导读者预约产品演示。

# Style(风格)
正式的科技产品发布稿风格,结构清晰,段落紧凑。可参考国内头部 SaaS 公司
(如飞书、钉钉)发布新版本时的官方推文写法,但避免过度使用感叹号与营销话术。

# Tone(语气)
专业、克制、自信。强调产品价值而非情绪渲染。涉及性能数据时使用客观陈述,
描述用户场景时可适度共情。

# Audience(受众)
主要读者为中型企业的 IT 负责人、数据分析团队负责人、CIO。他们关心的是
落地成本、与现有系统的兼容性、对业务的实际价值,而非底层技术细节。

# Response(响应格式)
- 总长度 800 至 1000 字
- 输出为 Markdown 格式
- 包含以下小节:
  1. 标题(一级标题,体现 v3.0 与"自然语言"两个关键词)
  2. 引言段(约 150 字,点出本次更新的整体意义)
  3. 三大更新(每项以二级标题呈现,下设场景描述与价值说明)
  4. 客户价值小结(约 150 字)
  5. 行动号召(一句话引导预约演示,附预约入口提示)
- 不要使用第一人称"我",统一使用"我们"或公司视角
- 不要编造具体客户名称或客户引言

适用场景

CO-STAR 在以下场景中表现突出:

  • 营销文案、新闻稿、品牌故事
  • 客户邮件、商务信函、对外公告
  • 公众号、小红书、知乎等平台的内容创作
  • 面向特定受众的科普文章与知识分享
  • 演讲稿、致辞、宣传片旁白

简而言之,凡是"写给人看的文字",CO-STAR 都是首选。


BROKE 框架

BROKE 框架源自工程实践社区,相比 CO-STAR 更强调任务的可执行性与产出的可验证性。它由五个要素组成:

要素英文全称含义写作要点
BBackground(背景)任务场景与已知条件与 CO-STAR 的 Context 类似,但更偏重"客观事实"而非"沟通氛围"。常见内容包括数据来源、技术栈、约束条件(如不能联网、不能调用外部库)、历史尝试与已知失败原因等。
RRole(角色)模型扮演的专业角色BROKE 区别于 CO-STAR 的关键设计。通过为模型分配一个具体角色(如"你是一名拥有十年经验的 Python 后端工程师"),可以隐式激活该角色对应的知识体系与思维方式。注意角色设定要与任务匹配,过度宽泛(如"你是一位天才")反而无效。
OObjectives(目标)需要完成的具体子任务列表通常以编号列表形式呈现,将复杂任务拆解为可逐项核对的子目标。这种写法在非推理模型下尤其重要,因为模型不会自行规划任务步骤,提示词必须替它完成规划。
KKey Result(关键结果)输出的验收标准BROKE 的精髓所在。要求提示词作者预先定义"什么样的输出算合格",并把这个标准写进提示词。常见的关键结果包括:代码可在 Python 3.11 下直接运行、JSON 输出符合给定 Schema、报告必须包含至少三组数据对比、所有断言必须有引用依据等。
EEvolve(迭代)自我检查与下一轮改进接口要求模型在生成输出后进行自检,或为人工迭代留出明确接口。例如要求模型在结尾列出"本次输出的局限性"或"建议下一轮提示词改进的方向"。这一步把一次性提示词转化为可迭代的工程产物。

使用技巧

  • Role 与 Objectives 是 BROKE 的发力点,写得好就成功了一半
  • Key Result 不要写"输出要好"这种空话,要写"哪些条件全部满足才算好"
  • Evolve 部分可以让模型自己列出"分析的局限"或"需要补充的信息",相当于免费做了一轮自我审稿
  • 复杂任务可以把 Objectives 写成 5 至 10 步的清单,比期待模型自己拆解更可靠

完整示例:客户反馈数据分析

提示词:

# Background(背景)
我们是一款面向中小企业的财税 SaaS 产品,最近一个月内通过客服渠道、应用商店
评论、用户调研三种来源收集到约 240 条用户反馈。这批反馈已经整理为统一的
CSV 格式,字段包括:feedback_id、source、submitted_at、user_segment、
raw_text、initial_label。其中 initial_label 是客服初步打的标签,但准确率
仅约 70%,不可完全依赖。本次分析的产物将用于下周的产品月会决策。

# Role(角色)
你是一位拥有八年经验的 B 端 SaaS 产品分析师,擅长从非结构化用户反馈中
提炼可执行的产品洞察,熟悉 Jobs-to-be-Done 与 Kano 模型。

# Objectives(目标)
基于我接下来粘贴的反馈文本,完成以下任务:
1. 将所有反馈归并为不超过 8 个主题类别,每个类别给出明确定义。
2. 统计每个类别的反馈数量,并按数量降序排列。
3. 对排名前 3 的类别,分别给出代表性反馈摘录(每个类别 2 至 3 条原文片段)。
4. 针对前 3 个类别,输出对应的产品改进建议,每条建议需说明:
   - 建议要解决的具体问题
   - 建议的方向(不要求技术细节)
   - 预期的用户价值
5. 标注哪些反馈属于"信号噪音"(如纯抱怨、与产品无关、明显误用),并简述判断依据。

# Key Result(关键结果)
合格的输出应同时满足以下条件:
- 输出格式为 Markdown,包含上述 5 个小节,分别使用二级标题。
- 类别定义需互斥,避免同一条反馈可同时归入多个类别。
- 所有数量统计必须与"分类汇总表"一致,不能出现总数不符。
- 改进建议必须聚焦产品层面,不涉及销售、价格、服务态度等非产品维度。
- 全文不引入 CSV 中未出现的虚构信息。

# Evolve(迭代)
在正文之后追加一节"分析的局限与建议",指出:
- 本次分析中你识别出的、需要更多数据才能下结论的灰色地带;
- 如果允许下一轮提问,你建议我补充哪些信息以提升洞察质量;
- 哪些类别的样本量偏少(少于 5 条),其结论需谨慎对待。

请确认你已理解上述要求,然后等待我粘贴反馈数据。

适用场景

BROKE 在以下场景中表现突出:

  • 数据分析与洞察提炼
  • 代码生成、代码审查与重构建议
  • 技术方案撰写、架构评审
  • 结构化信息抽取(如从合同、简历、报告中提取字段)
  • 流程自动化任务(如批量分类、批量打标)
  • 需要多轮迭代、产物会被复用的复杂任务

简而言之,凡是"输出需要被验证、被使用、被迭代"的产物,BROKE 都更合适。


CO-STAR 与 BROKE 的选择

两个框架并非互斥,而是各有侧重:

维度CO-STARBROKE
核心倾向沟通与表达工程与验证
关键差异Style + Tone + AudienceRole + Key Result + Evolve
典型场景文案、新闻稿、邮件、科普分析、编程、抽取、报告
输出特征注重可读性与情感共鸣注重正确性与可验证性
学习曲线较平缓,要素直观略陡,需预先思考验收标准

实际工作中也存在融合写法。例如撰写一份"面向投资人的技术尽调报告",既需要 CO-STAR 中对受众与风格的精细控制,也需要 BROKE 中对结论可验证性的严格要求。这种情况下,可在 BROKE 的 Background 之外补充 Audience 与 Tone 字段,组成自定义混合框架。


面向非推理模型的优化建议

在两套通用框架之外,结合 DeepSeek-V4 非推理模式的特点,还有几条特定优化建议:

善用上下文:V4 系列支持百万 token 上下文,可以一次性放入完整资料。但在非推理模式下,过长的无关信息会稀释关键指令的权重。建议把核心任务说明放在提示词的开头与结尾两个位置,中间放参考资料。

输出样例:非推理模型不擅长从抽象描述推断格式细节。需要 JSON 输出时,直接在提示词里给出一个填好示例值的 JSON 模板;需要表格时,直接给出表头。

约束优先:"不要使用感叹号""不要编造数据""不要超过 500 字"这类否定式约束,比"请保持克制""请尊重事实""请简洁"等正向鼓励更有效。

显式编号:多步骤任务不要假设模型会自动规划。BROKE 框架的 Objectives 部分采用编号列表正是这个原因。

先简后繁:非推理模式调用成本低、响应快,适合"快速迭代提示词"的工作方式:先用一小段样本测试提示词效果,确认后再批量处理。

评论

0
还没有评论,来写第一条吧