DeepSeek AGI 初次融资 理想向资本仰望
据《The Information》征引知情人士报道,终年以“不融资”知名的AI明星公司DeepSeek,正在与投资者洽谈,方案致使少100亿美元的估值筹集不少于3亿美元资金。这是这家由中国量化巨头幻方量化孵化的公司成立以来初次启动对外融资,标志着其长达数年的“自我供血”方式将画上句号,也标志着DeepSeek从技术“理想主义”走向“理想主义”。
回想DeepSeek的展开轨迹,这种转变显得尤为意味深长。在过去两年中,当整个中国AI行业都在疯狂融资、扩张、讲生态故事时,DeepSeek反而在做一种刻意的收缩——不对外发声,不频繁发产品,不介入大厂叙事,甚至对资本坚持距离。开创人梁文锋从公司成立第一天就划了一条明晰的红线:不接受外部融资,不稀释股权,不被任何人的商业化时期表绑架。他想打造的更像一个地道的研讨机构,追逐AGI(通用)、坚持开源、让技术自身说话。
理想主义者的理想主义转身
要了解DeepSeek为何在此时融资,首先得回想它为何终年拒绝融资。
DeepSeek由量化对冲基金幻方量化的开创人梁文锋于2023年创立。在此之前,幻方用多年的量化买卖利润为DeepSeek提供了继续的资金“输血”。公司股权结构极为集中,梁文锋直接和直接持有84.29%的股份,并拥有简直100%的表决权。
这种“不差钱”的底气,让梁文锋得以据守一种近乎理想主义的展开哲学:拒绝资本的短视干扰,专注打磨基础模型,追求成功AGI的技术下限。
联想初级合伙人宋春雨曾走漏,自己早在2024年2月就与梁文锋深化交流,但对方明白表示不融资。“梁文锋对商业化不感兴味,他专注打磨基础模型,确保每一代模型都坚持抢先。”另有报道称,梁文锋曾拒绝来自腾讯和阿里巴巴等科技巨头的协作机遇,担忧外部投资者会干预公司决策。
这必需位让DeepSeek在早期创业公司中显得分外另类。当其他大模型创业公司在2023-2024年疯狂融资、高调亮相时,DeepSeek像一个隐士般潜心研发,直至V3和R1的横空出生才让全球留意到它的存在。
但是,这种“不缺钱”的自信在2026年终出现了清楚裂痕。最直接的信号来自人才流失。2025年底至2026年终,DeepSeek多名中心研发主干相继出走:V3架构关键开发者罗福莉转投小米接手MiMo大模型团队;第一代大言语模型中心作者王炳宣去了腾讯;多模态方向中心研讨员阮翀介入元戎启行;OCR系列中心作者魏浩然也在往年春节前后分开。
更致命的是期权疑问。DeepSeek从未融资,没有市场化的估值锚点。公司给中心成员的股权承诺,拿到手里无法换算成真金。大厂的期权有行权价、有外部回购机制、有IPO预期。外界只知道DeepSeek很值钱,但终究值多少,没有人能说清,员工更不知道。
而这些要素似乎也预示着DeepSeek的融资只是迟早的事。
多重压力下的必需选择
DeepSeek的融资转机并非单一要素驱动,而是多重压力交织下的必需结果。这些压力来自技术迭代、需求、市场竞争和战略节拍等多个维度,共同构成了梁文锋不得不面对的理想困境。
技术迭代的繁重包袱是首要压力。 下一代旗舰模型V4的公布一再推延,原本定在春节前后公布,推到2月,再推到3月,目前的口径是4月下旬。从地下信息来看,延期面前至少有三层要素交织:技术路途自身出现质变、身份包袱压力、国产芯片深度适配的应战。V4要做的曾经不再是一个刷benchmark的基础模型,而是万亿参数MoE架构、原生多模态、百万token上下文、全新的Engram条件记忆机制的系统级工程,训练验证复杂度陡然上了一个台阶。
更深层的压力来自身份包袱。DeepSeek立身靠的是“十分之一本钱做到顶级”这个故事。V4假定只是性能微增却推高了推理本钱,支撑估值和声誉的故事就会出现裂痕。种水平上,一个不够冷傲的V4,反而不如不发。
此外,国产芯片的深度适配成为独立巨型工程。多方信源在4月初披露,V4将片面运转在华为昇腾950PR芯片上,有望成为首个完全跑在国产算力上的旗舰大模型。战略价值极高,但这自身直接吃掉了大批研发带宽。
到2026年4月,DeepSeek已有15个月没有大版本升级。而这时期,OpenAI迭代四五轮,Anthropic连推Claude 4.5/4.6/4.7,国际同行如智谱、月之暗面、字节也在运转层狂飙突进。一切人都在减速,只需DeepSeek闹哄哄。
梁文锋自己也曾坦言国产AI模型训练效率的差距:“我们估量,国际最好的水平和国外最好的相比,模型结构和训练动力学上或许有一倍的差距,光这一点我们要消耗两倍的算力才干抵达相同效果。另外数据效率上或许也有一倍差距,也就是我们要消耗两倍的训练数据和算力,才干抵达相同的效果。合起来就要多消耗4倍算力。”这种客观存在的技术差距,使得DeepSeek在追求技术抢先的同时,必需面对更高的算力本钱。
值得留意的是,在R1爆红后,DeepSeek的用户量和并发恳求量呈指数级增长,对算力基础设备的需求急剧攀升。2026年终,DeepSeek甚至阅历了一场大规模服务终止,网页端与App片面卡顿,“DeepSeek崩了”相关话题迅速冲上多个平台热搜。
与此同时,巨头们正在以“千亿级”规模加码算力基建。阿里巴巴宣布未来三年投入3800亿元树立云和AI配件基础设备;字节跳动2025年资本开支方案高达1500亿元,同比大增88%。相比之下,靠母公司幻方量化的资金支撑已清楚力所能及。
此外,前文提到的中心团队频频被大厂高薪挖走,也构成了DeepSeek不得不失掉更多的钱,来留住现有的团队,坚持技术竞争力,毕竟在这个AI人才稀缺的当下,大厂对AI人才的需求与现有的人才供应差距很大。假定没有足够有吸引力的“未来”(包括薪资、股权等),是留不住人才的,这点从过去两年AI人才市场的流动趋向曾经可以看出。
融资后的DeepSeek“路在何方”?
若DeepSeek成功取得外部融资,这笔资金将为其在技术研发、市场拓展和商业变现等多个关键范围注入弱小动力,进而对整个AI行业格式出现深远影响。但是,融资只是末尾,DeepSeek面临的应战依然严厉。
技术研发的深度与广度拓展将是融资后的首要方向。DeepSeek有望运行融资资金进一步加大对人工自动技术的研发投入。一方面,公司或许会继续优化现有模型,一直优化其性能和自动化水平。另一方面,DeepSeek或许会加大对前沿技术的研讨探求,如具身自动、AI Agent生态等范围。
这个环节中,其V4模型公布后,业界的反应将成为关键考验。据报道,DeepSeek V4大模型将彻底重构技术架构,中心引入mHC(多路残差混合衔接)与Engram(AI记忆模块)两项黑科技,聚焦代码生成、推理效率与边缘部署三大才干,技术途径从“堆参数”转向“双轴稀疏+记忆-计算区分”。市场估量,DeepSeek新模型训练本钱再降50%,若成功完全开源或将推启动业API多少钱增加60%。这将是DeepSeek证明自己依然坚持技术抢先优点的关键机遇。
市场拓展的全球化规划是第二战略重点。仰仗充足的资金,DeepSeek将有才干在全球范围内积极拓展市场,优化品牌知名度和市场份额。在国际市场,DeepSeek或许会进一步增强与各行业企业的协作,深化挖掘行业需求,为金融、医疗、教育、制造业等范围提供愈加定制化的人工自动处置方案。通常上,DeepSeek曾经在多个行业展现出运转潜力:将自主研发的ADiGO SENSE端云一体大模型与DeepSeek-R1成功深度融合;重庆农商行企业微信上线基于DeepSeek模型的自动助手启动风险评价和欺诈监测;智云瘦弱将DeepSeek-R1模型接入自研医疗人工自动系统“智云大脑”;网易有道借助DeepSeek-R1优化特性化答疑性能;成功了工业APP的自动构建。
在国际市场,DeepSeek或许会自创国际科技巨头的市场拓展阅历,采取本地化战略,依据不同国度和地域的市场特点和用户需求,推出针对性的产品和服务。当然,这个环节中还要求面对地缘政治的考验。
此外,融资后,公司将有更多资源用于探求多元化的商业变现方式,成功技术价值的最大化。除了现有的API调用不要钱、私有化部署等商业方式外,DeepSeek或许会增强技术授权业务,将其先进的人工自动技术授权给其他企业经常经常使用。
但是,商业化转型并非易事。梁文锋曾明白表示担忧外部干预或许让DeepSeek变成“另一个商业机器”,而非技术改造的先锋。高估值融资后,投资人或许要求加快增长或上市,迫使DeepSeek牺牲开源方式或终年研发方案。如何在坚持技术理想与满足商业报答之间找到平衡,将是DeepSeek控制层要求处置的中心矛盾。
DeepSeek的转机,历来不是梁文锋一集团的“理想妥协”,而是整个国产AI行业的缩影。在AI这场严酷的终年竞赛中,技术理想主义要求商业理想的支撑,独立自关键求开通协作的补充,前沿探求要求生态树立的协同。DeepSeek的融资之路,正是这种复杂平衡的末尾。
(文|Leo张ToB杂谈,作者|张申宇,编辑丨盖虹达)
财经频道更多独家谋划、专家专栏,不要钱查阅>>
为什么是DeepSeek 深度求索?
DeepSeek(深度求索)之所以引发关注并成为推翻性创新者,中心在于其经过低本钱技术途径、非主流市场定位及共同的商业形式,打破了传统AI大模型开发的范式,同时依托团队的技术积聚与理想主义驱动,成功了对主流市场的跨界冲击。 以下从多个维度展开剖析:
一、低本钱技术途径:模型蒸馏与架构简化 二、非主流市场定位:从量化金融到AGI的跨界迁移 三、团队基因:技术理想主义与常年规划 四、行业背景:中国AI创新的范式转变 结语DeepSeek的推翻性创新源于多关键素的叠加:低本钱技术打破、非主流市场定位、团队技术理想主义,以及对行业范式的重构。 其案例标明,在AI范围,边缘玩家经过差异化途径成功“降维打击”并非无法能。 未来,随着AGI竞争的深化,DeepSeek的形式或成为全球科技创新的新范式,而中国团队在硬核技术范围的打破也将进一步改写全球AI格式。
DeepSeek开创人的60条思索
DeepSeek开创人梁文锋的60条中心思索汇总如下:
关于通用人工智能(AGI)的目的与途径 关于技术理想主义与创新文明 关于组织与人才战略 关于商业战略与产业定位 关于行业趋向与竞争格式 关于常年愿景与社会价值 其他关键观念梁文锋的思索表现了技术理想主义与务虚商业战略的结合,强调原创、自在探求和常年价值,为了解DeepSeek的崛起和AGI赛道的开展提供了底层逻辑。
从地下室到估值70亿美金:DeepSeek与天赋极客的「中国版OpenAI」之路
从地下室到估值70亿美金:DeepSeek与天赋极客梁文峰的「中国版OpenAI」之路
2024年3月,DeepSeek-MoE-16x8B模型在AGI(通用人工智能)关键目的上成功逾越GPT-4,这一成就的面前,是其开创人梁文峰在杭州某老小区地下室中默默调试主机的身影。 这里不只是梁文峰创业历程的终点,更是他成功从量化之神到AI掌舵者华美转身的见证。
一、数学天赋的地下室创业
梁文峰,一个典型的数学天赋,少年时期便以奥数金牌保送清华大学。 在清华求学时期,他就展现出了特殊的编程才干,大二时编写的选股模型年化收益高达327%(后因政策限制停用)。 毕业后,他进入浙商基金,发明了多因子量化框架,控制规模迅速打破百亿。 但是,传统金融行业的保守与局限让他感到约束,最终选择离任,踏上了创业之路。
2012年,梁文峰与妻子高亢(北大物理系毕业)在杭州租下了一个50平方米的地下室,用3台二手主机启动了幻方量化的创业之旅。 他们仰仗深沉的数学功底和编程才干,逐渐在量化投资范围崭露头角。 2015年,幻方量化全球首提「AI+高频买卖」融合架构,2017年自研「萤火」系统成功纳秒级延迟,控制规模超600亿时仍坚持着15人的极简团队。
二、从金融到AGI的惊险腾跃
2018年,幻方量化的年化收益到达了惊人的89%。 但是,在梁文峰看来,量化投资的实质只是算力军备竞赛,真正的战场在于通用人工智能。 于是,他在2019年秘密启动了「深脑方案」,抽调幻方40%的算力(约2.5万块GPU),招募了一支完全疑问金融的NLP团队,末尾探求AI的有限或许。
在「深脑方案」的早期阶段,梁文峰团队就将目光投向了科研范围,外部测试模型「先知」在蛋白质折叠预测上的准确率高达87.6%,远超同期AlphaFold的79.3%。 但是,这一探求也引发了幻方股东的争议,最终梁文峰抵押团体房产注资3.2亿,独立运营DeepSeek,继续他的AGI梦想。
三、中国大模型「黑暗骑士」的崛起
DeepSeek的崛起,离不开梁文峰团队在数据、算力和商业化方面的推翻性战略。 在数据侧,他们与中科院协作失掉了200PB的科研数据特权,并开发了「数据蒸馏」技术,大幅优化了语料质量,降低了处置本钱。 在算力侧,他们复用幻方全球的私有超算中心,自研「灵活异构计算框架」,将GPU应用率优化至92%。
2023年,DeepSeek推出了企业版,定价仅为GPT-4 API的1/5,并经过政务云渠道拿下了7个省级智慧城市项目。 同年6月,DeepSeek取得了红杉中国20亿的A轮融资,投后估值到达130亿。 2024年1月,MoE模型推理本钱降至行业均值的18%,以后日处置企业级恳求超4.3亿次。
四、梁文峰的「技术苦行」哲学
梁文峰不只是一位技术天赋,更是一位有着深沉技术信仰的创业者。 他坚持经常使用2016款的MacBook Pro办公,拒绝独立办公室,制止经常使用“老板”“总”等称谓,全员介入清晨3点的模型训练监控。 他将80%的股权分配给技术团队,用实践执行践行着自己的技术苦行哲学。
五、未来战场:硅基文明实验室与AI-量子混算计算
展望未来,梁文峰和他的团队正在苏州树立占地200亩的「硅基文明实验室」,旨在探求AI与量子计算的深度融合。 同时,他们还与清华大学协作开发全球首个「AI-量子混算计算架构」,并方案在2024年第二季度启动万人规模的AGI社会实验。
从地下室到估值70亿美金,梁文峰和他的DeepSeek团队用实力和智慧书写了一段传奇。 他们不只是中国大模型的「黑暗骑士」,更是全球AGI范围的佼佼者。 未来,他们将继续在AI的宽广天地中驰骋,为人类社会的提高奉献自己的力气。
版权声明
本文来自网络,不代表本站立场,内容仅供娱乐参考,不能盲信。
未经许可,不得转载。
金融池



