



DeepSeek(深度求索)是一家迅速崛起的人工智能公司,其创始团队及发展历程融合了技术理想主义与商业化突破。以下是综合多个可靠来源的详细信息:
背景与教育
1985年出生于广东省湛江市,父母为小学教师。
17岁考入浙江大学电子信息工程专业,后攻读信息与通信工程硕士,师从项志宇教授,研究方向为机器视觉。
职业经历
量化金融领域:2015年与浙大校友共同创立幻方量化,凭借AI算法迅速跻身国内量化私募“四大天王”,管理规模超千亿。
AI转型:2023年7月创立DeepSeek,依托幻方的算力资源(如“萤火二号”超算,配备1万张A100 GPU)进军通用人工智能(AGI)领域。
个人特质
被业内称为“技术理想主义者”,以低调作风和极强的工程能力著称,常与一线研究员共同攻关。
2025年受邀参加国务院总理李强主持的专家座谈会,代表中国AI创新力量发声。
高华佐(核心技术成员)
北京大学物理系毕业,主导DeepSeek-V2的MLA(多头潜在注意力)架构创新,显著降低计算成本。
曾旺丁(架构工程师)
北京邮电大学通信专业背景,优化长文本处理与推理效率,推动关键指标突破。
赵成钢(训练/推理工程师)
清华大学超算团队核心成员,三次获世界大学生超算竞赛冠军,负责基础架构优化。
吴俣(后训练负责人)
北航博士,曾参与微软小冰项目,强化模型在复杂任务中的表现。
邵智宏(算法研究员)
清华大学交互式AI博士生,主导DeepSeek-R1的数学推理算法设计。
团队特点:以本土顶尖高校人才为主,融合量化金融与AI研发经验,注重开源协作与工程效率。
早期积累(2016-2023)
2016年梁文锋在浙大期间创立High-Flyer,探索AI交易算法;2021年建成“萤火二号”超算,储备算力资源。
独立运营(2023年)
2023年7月DeepSeek正式成立,发布首个开源代码模型DeepSeek-Coder,性能超越CodeLlama。
技术突破(2024年)
MoE架构创新:推出DeepSeek-V2(MLA技术),推理成本仅为GPT-4 Turbo的1/70.
多模态拓展:发布DeepSeek-VL(视觉语言模型)和DeepSeek-Prover(数学推理模型)。
全球影响力(2025年)
DeepSeek-R1:性能比肩OpenAI o1.成本仅其1/30.登顶中美应用商店下载榜。
行业接入:超20家央企、27家药企及多家三甲医院部署,阿里、腾讯等头部企业接入生态。