1. DeepSeek 是什么


基本信息一览

名称DeepSeek(深度求索)
语言中文、英文、日文、法文、西班牙文等多种语言
上线时间2023年7月(公司成立),2025年1月(R1模型发布)
开发商杭州深度求索人工智能基础技术研究有限公司
所属集团幻方科技(High-Flyer Capital Management)
网址https://chat.deepseek.com
开源协议MIT License(R1、V3 系列模型)

DeepSeek(深度求索)是由中国杭州的人工智能公司幻方科技旗下的 AI 研究机构研发的大语言模型与对话产品。公司于 2023 年 7 月正式成立,创始人梁文锋同时也是幻方科技的联合创始人。2025 年 1 月,DeepSeek 发布了其旗舰推理模型 DeepSeek-R1,凭借媲美 OpenAI o1 的推理能力和极低的训练成本(约 600 万美元,仅为 GPT-4 的数十分之一),在全球 AI 圈掀起巨浪,一度登顶苹果 App Store 和 Google Play 下载榜首。

DeepSeek 的技术核心在于其高效的混合专家架构(Mixture-of-Experts,MoE)和多头潜在注意力机制(MLA),使模型在保持顶级性能的同时,大幅降低了训练和推理的资源消耗。V3 系列模型拥有 6710 亿参数(每次推理激活约 370 亿),而 R1 系列则专注于通过强化学习和思维链技术,在数学推理、代码分析等复杂任务上实现出色表现。