2. Gemini 3 提示词要点


本节依据 Google 官方的 Gemini 3 提示工程文档编写:https://ai.google.dev/gemini-api/docs/prompting-strategies?hl=zh-cn#gemini-3

在撰写提示词之前,需先了解 Gemini 3 相对早期模型的几项核心差异。许多看似异常的行为均源于以下特性。

1. 默认启用推理过程

Gemini 3 系列默认开启动态思考(Dynamic Thinking):在输出最终回答前,会在内部生成一段不可见的推理链。由此产生两项直接影响:

  • 无需再依赖 "请逐步思考""请先列出推理过程" 等显式触发推理的写法。该类指令在 2.5 系列中有效,但在 3 系列中已属冗余,甚至可能引发副作用——对简单问题产生过度推理,导致输出冗长或表述迂回。
  • 若此前在 Gemini 2.5 上使用复杂的 chain-of-thought 提示以强化推理,迁移至 3 系列后应主动精简提示词,将推理空间交由模型自身处理。

但对于确需深度推理的复杂任务(高难度数学、长链逻辑、跨文档综合分析等),可在提示词末尾追加 "回答前请进行深度推理" 之类的指令,仍可进一步提升表现,代价是响应时延增加。

2. 默认输出更为精炼

Gemini 3 默认倾向于直接、高效的回答,篇幅显著短于 2.5 系列。如需更详尽、更具对话感的输出,必须显式声明。例如:

请以友好、对话化的助手语气进行讲解,可适当辅以示例与类比。

反之,若需要更精简的输出:

直接给出结论,省略推理过程。

3. 知识截止日期为 2025 年 1 月

Gemini 3 的训练数据截止于 2025 年 1 月。涉及 2025 年 2 月之后的事件(新颁布的法规、新发布的产品、最新赛事结果等),模型要么无相关知识,要么会基于既有知识进行外推性猜测。可采用以下两种方式应对:

  • 在网页端启用"使用 Google 搜索" / Grounding 开关(具体名称视界面而定),让模型检索实时信息。
  • 将最新资料作为上下文粘贴到对话中,并明确指示模型"仅基于所提供内容作答"。

八条核心原则

以下八条由两份官方指南提炼而来,附中文示例。

1. 指令应精确、直接,避免赘述与请求式语气

Gemini 3 偏好简洁清晰的指令,对冗长的劝说式表述响应较差。

反例:

你好!我现在有一个非常重要的任务需要你帮忙完成,希望你能尽最大努力,认真仔细地阅读下面这段我精心整理的文字,然后帮我从中找出三个我可能没注意到的逻辑漏洞,谢谢!

正例:

找出下面这段文字中的三处逻辑漏洞。

[文字内容]

模型无需被礼貌引导,只需被明确告知。

2. 结构保持一致,避免混用

清晰的分隔符(XML 标签或 Markdown 标题)有助于 Gemini 3 准确区分上下文、任务说明与约束条件。但同一提示词中应仅使用一种格式——同时混用 XML 与 Markdown 会增加模型解析负担。

XML 风格示例:

<role>
你是一位资深中文编辑。
</role>

<constraints>
1. 不得改动原文事实。
2. 保留作者原有语气。
</constraints>

<context>
[在此粘贴待润色稿件]
</context>

<task>
对上述稿件进行润色,输出修改版本,并在末尾以列表形式标注主要改动。
</task>

Markdown 风格示例:

# 身份
你是一位资深中文编辑。

# 约束
- 不得改动原文事实
- 保留作者原有语气

# 任务
对下面的稿件进行润色,输出修改版本,并在末尾以列表形式标注主要改动。

# 稿件
[在此粘贴待润色稿件]

两种风格效果相当,选择其一并贯彻始终即可。

3. 明确定义模糊术语

任何存在多种解读可能的词汇,应预先给出明确定义。例如"简短"指 100 字还是 500 字?"专业"指术语密集还是简洁严谨?

反例:

给我一份关于量子计算的简短介绍。

正例:

撰写一份关于量子计算的介绍,目标读者为无物理背景的大学生,篇幅 300–400 字,除"叠加""纠缠"外不得使用其他专业术语。

4. 显式指定输出长度与详尽程度

承接前述"默认输出精炼"特性——若未声明,模型默认返回精简答案。如需其他风格,必须明示。

示例:

详尽程度:高
语气:技术性,但不刻板
长度:约 800 字
结构:先以 100 字撰写执行摘要,再分三个小节展开论述

5. 多模态输入应明确指代

当提示词中同时包含文本、图像、PDF、视频等多种输入时,应将其视为同等地位的输入源,并在指令中明确指定操作对象。

反例(输入为一张图表):

分析一下。

正例:

请查看上方图表。蓝色曲线在 2023 年 Q3 出现明显下行趋势,请仅基于图表所示数据分析三种可能成因,并标注每项推断所依据的具体数据段。

6. 关键指令置于开头或结尾

Gemini 3 在处理长提示词时存在注意力焦点效应:

  • 角色定义、输出格式要求、核心行为约束——应置于提示词起始位置(或系统指令中)。
  • 具体任务问题——当上下文较长(粘贴整本书、整份代码、大段文档等)时,应置于末尾,紧随上下文之后。

原因在于:模型在长上下文中有时会在首个相关匹配点停止扫描后续内容。将问题置于末尾可强制模型完整处理整段上下文后再作答。

7. 长上下文应遵循"先料后问"顺序

承接上一条,模板结构如下:

[大段上下文:文档、代码、聊天记录、视频转写……]

基于以上信息,请回答:[具体问题]

切勿采用"先提问,后附材料"的顺序——此顺序下模型可能先凭先验直觉作答,再勉强对齐到上下文。

8. 使用过渡句锚定上下文

在大段资料与具体问题之间插入一句桥接性指令,可显著降低模型脱离上下文进行编造的概率。常用锚定句包括:

  • "基于上述整份文档……"
  • "仅依据上方所提供资料……"
  • "综合上述所有相关段落……"
  • "请将上述内容视为唯一的事实来源……"

常见误区

本节内容源自 Vertex AI 官方指南中价值较高但常被忽视的部分,列举了一系列"看似合理但实际产生反效果"的写法。

宽泛的否定指令可能影响基础运算

反例:

利润是多少?不要推断。

"不要推断"这类开放式否定指令会导致 Gemini 3 过度审慎,甚至可能拒绝执行"销售额减成本"这类基础计算,直接返回"无法回答"。

正例:

你的任务是严格基于下方文本进行计算与逻辑推导,但不得引入文本之外的外部知识。

将"不要 X"改写为"仅使用 Y",模型的依从性更高。

复杂任务中前置约束可能被丢失

当请求复杂度较高时,模型可能忽略开头声明的格式要求或字数限制。解决方法是按以下顺序组织提示词:

  1. 上下文与原始材料
  2. 主任务说明
  3. 否定性约束、格式约束、数量约束置于最末行

示例:

[文章原文]

请总结上文核心观点。

**关键约束:**总结篇幅不超过 150 字,不得使用项目符号,不得提及作者姓名。

模型可能为维护角色一致性而违反其他指令

Gemini 3 对所设定的角色(persona)具有较高的执行优先级,有时会为贴合角色而忽略其他约束。因此:

  • 角色设定应避免模糊场景
  • 关键输出格式约束应置于角色定义之外

示例(严格数据提取场景):

你是一个数据提取器。禁止进行任何澄清、解释或对术语的扩展。
原样输出文本。不得说明理由。

此类"强约束角色"用于对抗模型默认的"提供额外帮助"倾向。

与现实冲突的虚构设定可能被模型悄然忽略

若指令为"在我们的设定中,螃蟹是虚构生物,从未存在过",再要求模型据此生成文本,Gemini 3 可能因该假设与训练数据存在矛盾而回归现实知识,输出"螃蟹属于节肢动物,栖息于海洋……"等内容。

解决方法是显式声明"上下文为唯一事实来源":

你是一个严格基于用户上下文作答的助手。回答中仅可依赖上下文中直接陈述的事实,
不得使用自身知识或常识。不得基于已知事实进行假设或推断,仅可如实陈述。
任何未在上下文中明确出现的事实,须一律视为不真实且不被支持。
若上下文未明确给出答案,必须回复"信息不可用"。

分步验证以抑制幻觉

当问题涉及模型未掌握的冷门信息,或超出其实际能力范围(例如访问实时网页)时,模型有时会为满足用户期望而生成看似合理但实际错误的回答。

应对方法是将任务拆分为两步——先验证,再作答:

请先以高置信度确认:你是否能够访问《纽约时报》今日首页?
若无法确认,请回复"No Info"并终止。
若可确认,再继续生成回答。

查询:总结《纽约时报》今日头条。

此类"先自检后执行"的提示可显著降低幻觉率。

信息分散于多处时,模型可能仅匹配首个出现位置

若所提供资料中相关信息分布于多个段落或章节,模型可能在定位到首个匹配后停止扫描后续内容。

应对方法:

  • 将具体问题置于全部上下文之后
  • 使用"基于上述整份文档,请综合所有相关信息……"等锚定句

评论

0
还没有评论,来写第一条吧