1. DeepSeek 是什么

基本信息一览
DeepSeek(深度求索)是由中国杭州的人工智能公司幻方科技旗下的 AI 研究机构研发的大语言模型与对话产品。公司于 2023 年 7 月正式成立,创始人梁文锋同时也是幻方科技的联合创始人。2025 年 1 月,DeepSeek 发布了其旗舰推理模型 DeepSeek-R1,凭借媲美 OpenAI o1 的推理能力和极低的训练成本(约 600 万美元,仅为 GPT-4 的数十分之一),在全球 AI 圈掀起巨浪,一度登顶苹果 App Store 和 Google Play 下载榜首。
DeepSeek 的技术核心在于其高效的混合专家架构(Mixture-of-Experts,MoE)和多头潜在注意力机制(MLA),使模型在保持顶级性能的同时,大幅降低了训练和推理的资源消耗。V3 系列模型拥有 6710 亿参数(每次推理激活约 370 亿),而 R1 系列则专注于通过强化学习和思维链技术,在数学推理、代码分析等复杂任务上实现出色表现。