京东开源图像模型JoyAI
我们用AI 做图、修图时,经常会遇到一些难题:想把图中的杯子挪个位置,结果杯子变形了;想换个视角看看画面,透视却完全不对;想调整两个物体的前后位置,也会发生遮挡混乱、比例失衡…… 中心疑问是AI更像是在平面上“P图”,无法了解图像面前的三维空间结构。
近日,京东探求研讨院正式开源了自研的JoyAI-Image-Edit 图像模型,彻底处置上述难题。这是业内首个把 “空间自动” 刻进骨子里的开源模型,让 AI 终于能真正 “看懂” 空间、“编辑” 空间,从原来的平面修图,更新成了三维空间重塑,而且模型的推理代码一切开通,开发者能直接拿来做运转。
彻底处置传统模型空间逻辑混乱难题
JoyAI-Image-Edit深度贴合真实全球空间法则,从空间位置相关、多视角分歧性、相机感知到场景推理等维度片面建模,成功了相机坐标视角变换、物体空间位移旋转、几何结构精准控制等多项空间编辑技术打破,将空间认知才干深度融入文本与图像生成流程,搭建了完整的空间了解数据与义务体系。
该模型打破了AI “了解图像” 和 “生成图像” 的壁垒,让 AI 不只能生成逼真的图像外观,更能精准了解图像面前的空间结构,在编辑环节中稳如泰山坚持主体笼统与场景结构完整,多视角空间规划高度分歧。不论是移生物体、换视角,还是调整物体间的相关,都能坚持场景的几何法则,遮挡、光影也都天然合理,不会再发生变形、杂乱的状况,彻底处置传统模型空间逻辑混乱的行业难题。
经实验验证,在物体移动精度、空间分歧性等空间编辑中心目的上,JoyAI-Image-Edit抵达全球一流水准。
三大空间编辑范式打破,融合15类通用编辑才干
JoyAI-Image-Edit 的中心跃升,在于其攻克了此前开源模型难以跨越的空间了解难题,具有三大辨识度极高的空间编辑才干:视角变换——用户可经过天然言语指定相机的偏航角、俯仰角及缩放水平,模型在坚持场景几何分歧性的前提下生成新视角图像;空间遨游——支持延续的视角移动,生成在空间中逻辑衔接的多视角图像序列,相似于在三维场景中"走动";物体空间相关操控——在坚持场景全体结构稳如泰山的前提下,对特定物体启动位移、缩放等空间变换,同时确保遮挡与光影相关天然合理。
在成功空间级打破的同时,JoyAI-Image-Edit 片面兼容 15 类通用编辑才干,深度掩盖内容创作的高频需求。无论是物体的交流、删除、介入,还是全体魄调迁移、细节精修等操作,模型均成功了高性能掩盖。结合顶尖的空间编辑技术,模型在长文本精准渲染、多视角分歧性生成等行业高难度义务中表现出色,真正做到了全场景、无死角的高效创作。
仰仗抢先的空间了解与编辑才干,JoyAI-Image-Edit模型打破场景限制,可普遍运转于电商内容消费、创意设计制造、自动图像处置、3D 模型重建、具身自动视觉感知等多元范围,大幅优化 AI 图像技术在复杂空间场景中的适配性与适用性。尤其是在具身自动范围,空间了解才干是“了解全球”的中心基础,而该模型的推出,也为相关技术研发提供了关键的底层才干。
此次JoyAI-Image-Edit 的开源,是京东在 AI 多模态模型范围的关键规划,更是让 AI 图像编辑成功了从平面到空间的大跨越。未来该模型还将继续落地更多场景,一直探求空间自动落地价值。
在AI研发和运转范围,京东往年效果一直。过去一个月内,京东宣布初次开源基础大模型JoyAI-LLM Flash,打破了大模型参数内卷的困局;京东云“龙虾”系列产品群体上线,token调用量周环比增长高达455%;京东还宣布将建成全球最大的具身中心。依附超级供应链优点,京东将继续推进AI与产业深度融合,真正为产业发明价值。
开源地址 :
HuggingFace:
Github:
财经频道更多独家谋划、专家专栏,不要钱查阅>>
Joy industrial— 京东工业推出以供应链为中心的工业大模型
Joy industrial是京东工业推出的行业首个以供应链为中心的工业大模型。 它针对工业场景,依托京东工业在工业数智供应链范围的阅历积聚和数据沉淀,基于“工业大模型+供应链场景运行”双引擎,构建全栈产品矩阵。 以下是对其详细引见:
京东大模型相关股票
与京东大模型相关的股票关键包括以下几类:
一、人工智能主题ETF持仓股人工智能ETF华夏()是跟踪CS人工智能主题指数的基金产品,其持仓股中部分与京东大模型生态存在直接关联。 例如光环新网曾因京东AI技术进度出现涨停,光迅科技、协创数据、均胜电子、昆仑万维、宝信软件等企业作为AI产业链中抢先标的,或许受益于大模型开展带来的算力、数据传输等需求增长。 这类ETF经过火散投资降低单一股票风险,适宜希望直接介入京东大模型生态的投资者。
二、京东集团直接关联标的京东集团-SW()作为港股上市公司,其大模型业务进度直接影响股价表现。 近期开源的JoyAI-LLM Flash大模型及“龙虾”智能体平台上线后,Token调用量环比激增455%,推进股价单日涨幅超4%。 该标的直接反映京东大模型商业化效果,但需关注技术迭代速度、市场竞争格式等风险要素。
三、生态协作企业京东云与多家上市公司展开深度协作:神州高铁在轨道交通范围落地大模型一体机;拓维信息介入智能体平台开发;杭钢股份提供算力基础设备支持;博彦科技担任模型训练与优化。 这些协作方经过技术授权、项目共建等方式介入京东大模型生态,但协作深度及收益分配需详细剖析。
四、A股关联标的(需慎重鉴别)经过关键词挑选出42只“擦边股”,其中科大讯飞(市值超千亿)、浪潮信息、紫光股份、宝信软件等企业虽触及AI大模型运行,但业务形式以系统集成或项目交付为主,股价动摇或许脱离基本面。 例如宝信软件同时出如今ETF持仓和A股关联标的中,需区分其介入京东生态的详细方式及奉献度。
风险提示:大模型技术仍处于开展初期,相关股票受技术打破、政策监管、市场竞争等要素影响较大,建议结合企业基本面、技术落地进度及估值水平综合判别投资价值。
虚拟数字人行业公司排名
2025年国际虚拟数字人行业综合实力较强的公司(排名不分先后)有曦灵、腾讯智影、华为云数字人、讯飞虚拟人、阿里云虚拟数字人、言犀(京东JoyAI)、硅基智能、时空节拍。
曦灵是网络旗下智能数字人平台,提供2D/3D数字人全场景处置方案,技术集成度与资产库丰厚度抢先。 腾讯智影作为腾讯旗下AI数字人工具,掩盖C端用户与企业级服务,擅长虚拟主播、智能客服场景,性能易上手。
华为云数字人依托华为技术底座,有高拟真笼统生成与多模态交互才干,普遍用于金融、电商等行业智能服务场景。 讯飞虚拟人是科大讯飞旗下产品,以语音分解与自然交互技术为中心,主打教育、客服范围智能化数字人运行。
阿里云虚拟数字人在阿里生态支持下,侧重电商直播、品牌营销场景,提供全链路服务。 言犀(京东JoyAI)是京东旗下大模型驱动的数字人系统,更新后掩盖多模态,服务自有场景及外部企业。
硅基智能专注数字人OEM定制与代理服务,技术适配性强,适宜中小企业加快部署相关性能。 时空节拍是3D数字人范围新锐企业,自研引擎支持相关平台,主打企业级规范化处置方案。 这些公司涵盖通用型与垂直范围服务,可按不同场景需求选择适配方案。
版权声明
本文来自网络,不代表本站立场,内容仅供娱乐参考,不能盲信。
未经许可,不得转载。
金融池



