GPU租金飙升48% 算力紧缺引发企业客户焦虑
淘金热正在迅速耗尽一种AI开发者无法或缺的资源:。
这场严重的算力紧缺曾经让重度用户堕入焦虑,迫使企业丢弃部分产品,并引发服务稳如泰山性疑问。这些疑问为AI热潮敲响了警钟——合理海量用户末尾依托先进AI工具优化消费力时,算力瓶颈却或许限制这些弱小新工具的通常成效。
过去几个月,“自动体AI”需求出现迸发式增长。这类自主型AI工具能独立成功各类义务,从编写软件代码到为房产经纪人布置看房行程。企业正争相抢占算力资源,以服务不时扩展且经常经常使用强度清楚优化的用户集体。
“一切人都在议论,但我以为全球真正充足的是Token。”洛杉矶工程师兼科技投资者Ben Pouladian表示。Token是AI中用于权衡义务消耗算力的计量单位。“现在的AI早已不只是我们站在冰箱前问菜谱的聊天,它在统筹义务,变得越来越自动。”
这一切都指向了科技兴盛史上重复发生的经典疑问:从19世纪铁路扩张到初电信与互联网迸发,需求增速不时远超企业失掉资源、搭建基础设备的速度。历史上,涨价往往是处置供应紧缺的独一手段,但此举对前沿AI公司而言风险微小——它们正为争夺用户展开剧烈竞争。
用于训练和运转AI模型的时租多少钱自去年春季以来大幅飙升。抢手聊天机器人Claude及其爆红的编程工具Claude Code的开发公司Anthropic近期频繁遭遇服务终止。该公司已末尾在高峰时段对用户实行Token用量限制,但这一措施引发大批用户埋怨,称自己很快就触达用量下限。
据报道,OpenAI叫停其视频生成运转Sora,部分要素便是腾出算力,以支持代号为Spud的全新AI模型驱动的编程与企业级产品。
OpenAI面向企业用户的API平台Token用量从去年10月的每分钟60亿飙升至3月下旬的150亿。
“我确实花了大批时期寻觅一切能暂时调用的算力。”OpenAI首席财务官萨拉・弗莱尔在近期一次性性面向投资者的地下视频中表示,“由于算力有余,我们眼下正自愿丢弃一些项目,做出十分困难的取舍。”
去年年底,规模最大的上市AI公司之一CoreWeave将多少钱上调逾20%,并要求小型客户签署至少三年的服务合约,此前这一期限仅为一年。美国(52.54,-0.17,-0.32%)剖析师上月末恢复对该公司的评级并给予“买入”评级,称其服务需求至少在2029年前都将继续供不应求。
纽约数据提供商Ornn的数据显示,近几个月来,英伟达全系列GPU在云端的现货租赁多少钱均大幅下跌。Ornn Compute多少钱指数显示,英伟达最先进的Blackwell系列芯片单小时租金已达4.08美元,较两个月前的2.75美元下跌48%。
自2月中旬以来,Anthropic全系统频繁宕机,部分企业客户已转而经常经常使用其他AI厂商的模型。
平台Retool开创人兼首席行动官David Hsu表示,他原本更偏向经常经常使用Anthropic的Opus 4.6模型驱动公司的AI自动体工具,由于他以为这是最适宜企业场景的模型。但他近期已切换至OpenAI的模型。“Anthropic的服务不时在频繁终止。”
互联网中心服务的牢靠性通常用“几个九”权衡,四个九即99.99%的在线率,也是软件公司对客户的经常出现承诺。截至4月8日,Anthropic的Claude API近90天在线率仅为98.95%。
“这很不失常。”AI推理初创公司Baseten结合开创人兼首席技术官Amir Haghighat表示,“想想AWS、、RDS或Stripe,它们都要求极高的稳如泰山性和在线率。但AI范围目前并非如此,这不是你心愿从为运转提供自动才干的公司那里取得的服务质量。”
在服务频繁终止的同时,Anthropic正派历迸发式增长。2025年末,该公司年度营收年化规模达90亿美元;到往年2月,这一数字飙升至140亿美元;两个月后再度翻倍,抵达300亿美元。
3月下旬,Anthropic突然宣布,将在时期任务日早5点至11点的高峰时段限制用户Token消耗额度。用户纷繁在社交平台埋怨。一位用户在X上写道:“我好几周都没触达Claude Code限额,结果这周45分钟就用完了。”
“我们正全力满足Claude日益增长的需求。”Claude Code担任人兼开发者鲍里斯・切尔尼在X上表示,“算力是我们慎重控制的资源,我们会优先保证经常经常使用产品与API的客户。”
美股频道更多独家谋划、专家专栏,不要钱查阅>>
七成企业拥抱AIGC,算力焦虑该怎样破
面对七成企业拥抱AIGC带来的算力焦虑,可经过优化算力系统设计、采用综合处置方案、构建开放多元算力平台等方式,成功算力的高效应用和灵敏扩展,从而缓解算力焦虑。 详细如下:
紧跟英伟达步伐,中国版“算力黄牛”来势汹汹
中国版“算力黄牛”指以山高控股为代表,经过规划算力基础设备、探求芯片技术,在AIGC时代构建算力生态体系的企业群体,其开展形式与美国独角兽企业CoreWeave相似,但更强调“算力+绿电”的协同生态构建。
图:CoreWeave以英伟达芯片为中心的算力云平台 图:山高控股经过并购与战略投资构建算力+绿电生态 图:AI芯片市场规模预测(2023-2027)总结:中国版“算力黄牛”以山高控股为代表,经过“算力基础设备+芯片探求+绿电协同”形式,在AIGC时代构建自主可控的算力生态。 其中心逻辑是整合资本、技术、产业资源,以生态化规划应对国际竞争,虽面临技术、市场、政策应战,但常年价值凸显,有望成为AI产业链的关键介入者。
新订单12月才干交付!英伟达GPU继续缺货涨价 客户“勒紧裤带”浪费经常使用
英伟达GPU因AI算力需求激增继续缺货涨价,新订单交付周期延伸至12月,客户自愿采取浪费经常使用战略。
版权声明
本文来自网络,不代表本站立场,内容仅供娱乐参考,不能盲信。
未经许可,不得转载。
金融池



