| 人工智能(AI) | 让机器模拟人类智能行为的技术,涵盖学习、推理、感知、决策等能力 |
| 机器学习 | AI 的核心方法,让机器从数据中自动学习规律,而非依赖人工编写规则 |
| 深度学习 | 机器学习的一个分支,基于多层神经网络处理复杂数据,是当前大模型的技术基础 |
| 神经网络 | 模仿人脑神经元结构的计算模型,由大量节点分层连接而成,用于识别数据中的复杂模式 |
| 大语言模型(LLM) | 经海量文本训练的超大规模模型,能理解和生成自然语言,如 GPT、DeepSeek 等 |
| 生成式 AI | 能够生成全新内容(文本、图片、音频、视频等)的 AI,区别于仅做分类或预测的模型 |
| Transformer | 一种深度学习架构,通过"注意力机制"高效处理序列数据,是现代大模型的核心结构 |
| 注意力机制 | 让模型在处理信息时聚焦于关键部分的技术,大幅提升了对长文本的理解能力 |
| 参数 | 模型在训练中学到的内部数值,规模常以"亿""千亿"计,参数越多通常表达能力越强 |
| 预训练 | 在大规模通用数据上训练模型、使其掌握基础知识与语言能力的阶段 |
| 微调 | 在预训练模型基础上,用特定领域数据进一步训练,使其更适配具体任务 |
| 提示词 | 输入给 AI 的指令或描述,用于引导其生成期望的输出,描述越清晰输出质量越高 |
| 提示词工程 | 通过设计与优化提示词来提升 AI 输出质量的方法与技巧 |
| Token | 模型处理文本的最小单位,一段文字会被拆分为若干 Token,输入输出长度常以此计量 |
| 上下文窗口 | 模型一次能够处理和"记住"的最大信息量,窗口越大越能理解长篇、连贯的内容 |
| 多模态 | 模型同时理解和处理文字、图片、语音、视频等多种信息形式的能力 |
| 智能体(Agent) | 能自主理解目标、规划步骤并调用工具完成任务的 AI 系统,而不只是被动回答 |
| RAG | 检索增强生成,让模型先检索外部资料再作答,以提升准确性、减少错误 |
| 幻觉 | 模型生成看似合理但实际错误或虚构内容的现象 |
| 推理 | 模型基于已有信息进行逻辑分析、得出结论的过程;"推理模型"擅长多步思考 |
| 微调对齐 | 通过特定训练让模型输出更符合人类意图与价值观的过程 |
| 计算机视觉 | 让机器"看懂"图像和视频内容的 AI 技术领域 |
| 自然语言处理(NLP) | 让机器理解、处理和生成人类语言的 AI 技术领域 |
| 文生图 / 文生视频 | 根据文字描述自动生成图片或视频的生成式 AI 技术 |
| 开源模型 | 公开模型权重、允许他人自由使用和改进的大模型,如 DeepSeek、Qwen 等 |
评论
0 条