1. DeepSeek 简介

DeepSeek(深度求索)是由中国杭州的人工智能公司幻方科技旗下的 AI 研究机构研发的大语言模型与对话产品。公司于 2023 年 7 月正式成立,创始人梁文锋同时也是幻方科技的联合创始人。2025 年 1 月,DeepSeek 发布了其旗舰推理模型 DeepSeek-R1,凭借媲美 OpenAI o1 的推理能力和极低的训练成本(约 600 万美元,仅为 GPT-4 的数十分之一),在全球 AI 圈掀起巨浪,一度登顶苹果 App Store 和 Google Play 下载榜首。
2026年4月24日,DeepSeek 正式发布 V4 版本,DeepSeek V4 主动将华为昇腾 950 纳入原生硬件验证体系,标志着中国头部 AI 模型在算力底座上首次实现对国产芯片的深度绑定。当顶级开源大模型不再以英伟达为唯一选项,全球 AI 算力的单一供应格局正在被实质性地打破。
DeepSeek 的技术核心在于其高效的混合专家架构(Mixture-of-Experts,MoE)和多头潜在注意力机制(MLA),使模型在保持顶级性能的同时,大幅降低了训练和推理的资源消耗。V4 系列推出了 V4-Pro 与 V4-Flash 两个版本:V4-Pro 拥有 1.6 万亿参数(每次推理激活约 490 亿),定位旗舰,对标顶级闭源模型;V4-Flash 总参数 2840 亿(激活约 130 亿),定位轻量高效。两者均支持百万级上下文窗口,并在数学推理、代码生成及 Agent 任务上达到开源模型最佳水平。

评论
0 条