kaiyun.com-苹果开源SHARP模型 单张2D照片秒级生成逼真3D场景
日期:2026-02-19

【kaiyuncom科技动静】近日,苹果公司发布了一项名为SHARP(Sharp Monocular View Synthesis)的开源人工智能模子,该技能仅需一张平凡2D照片,便可于不到一秒内天生具有真实标准感的高保真3D场景。相干研究结果以论文《Sharp Monocular View Synthesis in Less Than a Second》情势公然,并已经于GitHub、Hugging Face和苹果官方项目页面同步上线,激发开发者社区广泛存眷。

苹果开源SHARP模型 单张2D照片秒级生成逼真3D场景

据苹果研究职员先容,SHARP经由过程单次神经收集前向推理,于尺度GPU上快速回归出一个基在3D高斯点阵(3D Gaussian Splatting)的场景暗示。该暗示不仅保留了原始图象的色采与光照细节,还有能撑持及时衬着,从临近视角天生高分辩率、视觉联贯的新视图。尤为要害的是,该模子输出的3D布局具备器量一致性,即包罗真实世界中的绝对于标准信息,可撑持切合物理纪律的相机挪动。

苹果开源SHARP模型 单张2D照片秒级生成逼真3D场景

传统3D高斯重修要领凡是依靠数十甚至上百张多视角图象举行优化,而SHARP仅笔据张图象便可完成重修,其暗地里依托在于年夜量合成与真实数据上练习所患上的深度与几何先验常识。模子起首预计初始深度图,再联合进修到的场景布局纪律,一次性猜测数百万个3D高斯点的位置、颜色与协方差参数。不外,SHARP今朝重要合用在原拍摄视角四周的视点合成,尚没法靠得住天生彻底未见过的场景区域。

版权所有,未经许可不患上转载

-kaiyun.com
其他新闻
识别准确率96.5%,kaiyun.com机器狗守护宁夏戈壁滩无人区风电站
kaiyun.com隧道巡检机器狗首度交付新加坡电网
全球首只“机器藏羚羊”!kaiyun.com科技机器狗深入可可西里腹地
社交媒体
Wechat Bilibili LinkedIn Youtube Twitter Douyin