天博综合体育welcome,覆盖全网最新内容,实时更新不间断,精彩一手掌握_新万博体育
天博综合体育welcome 最近更新|更新列表|字母检索|下载排行|苹果专区|分类导航

当前位置:首页电脑软件布达拉宫 → 天博综合体育welcome v6.291.5183 安卓最新版

天博综合体育welcome

天博综合体育welcome

  • 电脑版下载
猜你喜欢
标签: 天博综合体育welcome 永利体育快速登陆
详情
介绍
猜你喜欢
相关版本

内容详情

天博综合体育welcome

克雷西 发自 凹非寺量子位 | 公众号 QbitAI

Meta的“分割一切”,这回给3D建模带来了新的范式——

现在,图像分割得到的切片,可以直接转换成3D模型了。

只要一张图,就能对里面的每个物体进行单独重建,有遮挡也不用怕。

这就是Meta MSL实验室刚刚发布的三维重建模型SAM 3D。

与此同时,MSL实验室之前投稿ICLR 2026的分割模型SAM 3,也终于露出了真容。

之前SAM 3就在一般图像分割的基础上增强了语义理解,论文一公布就备受关注。

现在又上新SAM 3D,许久不见出成果的Meta AI,总算是打出了一组王炸。

分割结果生成3D模型

SAM 3D家族包含两个新模型——SAM 3D Objects,用于物体和场景重建;以及SAM 3D Body,专注于人体,这两个模型均能够将静态2D图像转换为精细的3D重建模型。

SAM 3D Objects能够从单张自然图像中实现基于视觉的3D重建和物体姿态估计。

即使存在小物体、间接视角和遮挡现象等障碍,依然可以进行重建,弥补了仅凭像素不足以完成重建的不足。

SAM 3D Objects的性能显著优于现有方法,能够很好地泛化到多种类型的图像,并支持密集场景重建。

在与人类用户进行的直接对比测试中,其胜率至少达到其他领先模型的5倍。

类似地,SAM 3D Body在涉及不寻常姿态、图像部分被遮挡或多人等复杂情况下也依然能对人物进行建模。

相比其他人物重建模型,SAM 3D Body同样取得了SOTA成绩。

同时,Meta还与艺术家合作构建了SAM 3D艺术家物体数据集SA-3DAO,用于评估基于视觉的物理世界图像三维重建能力。

不只分割,还更懂语义

再来看SAM 3。

传统模型通常专注于使用固定的文本标签集进行对象分割,这限制了它们处理用户请求的能力,因为用户请求往往涉及分割预定义列表中不存在的概念。

这意味着现有模型可以分割像“人”这样常见的概念,但难以处理像“红色条纹伞”这样更细微的概念。

SAM 3则通过引入可提示概念分割功能克服了这些局限。

它能够查找并分割由文本或示例提示定义的概念的所有物体,消除了固定标签集的限制。

你可以直接通过文本指令,让SAM 3从图像中找到符合描述的物体。

也可以处理稍复杂的提升,例如输入“条纹猫”,SAM 3自己就能找出并分割图中所有带条纹的猫猫。

除了文本,还可以直接在图中选中某个物体,让SAM 3找到所有同类。

为了评估大词汇量检测和分割性能,Meta还创建了“基于概念的任意分割”(SA-Co)基准测试,用于图像和视频中的可提示概念分割。

与之前的基准测试相比,SA-Co要求模型识别更大的概念词汇量。

实验结果表明,SAM 3在可提示分割任务中刷新了SOTA。

在LVIS数据集的零样本分割任务中,SAM 3的准确率达到了47.0,比此前的SOTA 38.5提升不少。

在新的SA-Co基准测试中,SAM 3的表现至少比基线方法强2倍。

另外,在针对视频的PVS(Promptable Visual Segmentation)任务中,SAM 3的性能也优于SAM 2。

SAM如何实现?

SAM 3的核心架构建立在一个共享的Perception Encoder视觉骨干网络之上。

该骨干网络同时服务于检测器和追踪器两个模块,确保了图像特征提取的一致性与高效性。

其检测器部分基于DETR架构进行了改进,引入了包含文本提示和图像示例的提示Token。

这些Token与图像特征在融合编码器中通过交叉注意力机制进行交互,随后输入到解码器中生成对象查询。

为了解决开放词汇检测中常见的幻觉问题(即模型在目标不存在时仍强制预测出物体),SAM 3创新性地设计了一个Presence Head来解耦识别与定位任务。

该模块引入了一个可学习的全局存在Token,专门负责预测目标概念在当前图像中出现的概率,而原本的对象查询则专注于在假设目标存在的前提下计算局部匹配概率,最终的置信度得分为两者的乘积。

在视频处理方面,SAM 3继承并扩展了SAM 2的记忆机制,即通过追踪器利用记忆库存储过去帧的空间特征,将上一帧的掩码传播到当前帧。

为了处理新出现的物体,系统使用一种匹配函数,基于IoU等指标将追踪器预测的掩码与检测器在当前帧新发现的对象进行关联和更新,从而实现跨帧的身份保持与新目标的自动捕获。

SAM 3D Objects的核心则是通过两阶段的生成模型来实现几何与纹理的逐步构建。

首先,系统使用DINOv2编码器分别提取裁剪后的物体特征和全图上下文特征作为条件输入。

第一阶段的几何模型采用了一个参数量达12亿的流匹配Transformer,并结合了Mixture-of-Transformers(MoT)架构,主要用于预测物体的粗糙体素形状以及其在相机坐标系下的旋转、平移和缩放等6D布局参数。

当粗糙的几何结构确定后,第二阶段的纹理与精细化模型接手工作。

该模型基于稀疏潜在流匹配架构,仅从第一阶段预测的粗糙形状中提取活跃体素进行处理。

这种稀疏化处理极大地提高了计算效率,它可以细化几何细节并合成高保真的物体纹理,最终通过一对VAE解码器将潜在表示解码为网格(Mesh)或3D高斯溅射以适应不同的渲染需求。

为了支撑这一生成过程,Meta构建了一个独特的model-in-the-loop(MITL)数据引擎。

由于人类难以直接标注3D形状,该引擎让模型生成多个3D候选结果,利用Best-of-N搜索策略由人类标注员从8个候选中选择最佳匹配项。

然后,基于点云参考对齐物体在场景中的位姿,从而低成本地获取了大规模且精准的图像-3D配对数据。

针对人体结构的SAM 3D Body模型,其核心在于摒弃了传统的Skinned Multi-Person Linear模型,转而采用Momentum Human Rig表示法。

这种表示法将骨骼姿态与身体形状参数显式解耦,避免了传统模型中骨肉粘连导致的调整失真问题。

在模型架构上,SAM 3D Body采用了一种可提示的编码器-解码器设计,支持输入二维关键点或掩码作为提示Token,与图像特征一起指导推理过程。

为了解决全身模型往往难以兼顾手部细节的痛点,SAM 3D Body设计了独特的双路解码器结构。

虽然身体和手部共享同一个图像编码器,但在解码阶段分流——

身体解码器利用全局特征和Momentum Human Rig Token预测全身的姿态、形状及相机参数;手部解码器则专门关注手部裁剪图像的特征,利用交叉注意力机制处理手部细节。

这种设计通过在Token层面融合全身与手部信息,使得模型既能通过身体解码器输出连贯的全身网格,又能利用手部解码器的输出来修正末端细节。

网友评价其精妙之处在于它并非凭空臆造几何图形,而是像人类一样,利用日常经验推断几何形状,这意味着混合场景理解从此普及开来,是真正意义上的基础模型具身化。

现在,成为开发者的最好时机已经来临了。

项目主页SAM 3:https://ai.meta.com/sam3SAM 3D:https://ai.meta.com/sam3dGitHubSAM 3:https://github.com/facebookresearch/sam3SAM 3D Objects:https://github.com/facebookresearch/sam-3d-objectsSAM 3D Body:https://github.com/facebookresearch/sam-3d-body论文地址SAM 3:https://ai.meta.com/research/publications/sam-3-segment-anything-with-concepts/SAM 3D Objects:https://ai.meta.com/research/publications/sam-3d-3dfy-anything-in-images/SAM 3D Body:https://ai.meta.com/research/publications/sam-3d-body-robust-full-body-human-mesh-recovery/

相关版本

    多平台下载

    查看所有0条评论>网友评论

    发表评论

    (您的评论需要经过审核才能显示) 网友粉丝QQ群号:766969941

    查看所有0条评论>>

    相关软件
    金沙新官网 k1体育app下载链接 现金在线平台有哪些 BET登录APP 6UP扑克之星游戏注册 即时比分v90 万博官网多少 葡京会娱乐代理 酷游ku游登录入口网页版 捷报比分网球即时比分 飞仙传 亿博体育官网网页 胜游亚洲 众赢娱乐 快三平台app推荐 人人体育平台 深海捕鱼正版 beat365亚洲版官网 世界杯四场进球投注 微博可以下注世界杯吗 im电竞登录官网 金沙皇冠入口 m6米乐在线客服 澳门正规游戏平台app 黄金金版会员报 im体育平台首页 beat365最新版 欧宝APP官网 威尼斯人官方网站 乐鱼平台网站登录 九五至尊app下载 华体会官网买球 威廉希尔中文网站平台 188体育篮球比分 能买足球滚球的手机app yabo22vip手机版登陆 必赢国际游戏登录 云顶娱乐app手机版 刺激战场国际服真人多吗 买球网站投注 立博官网平台 鹿鼎彩票平台官网登陆 必发365官网 千亿怎么开户 必赢国际真人色碟 a8体育下载免费 am8亚美app 12bet注册送18 2026世界杯开户 世界杯买球胜负怎么买 天博手机APP 最大赌博娱乐平台 日博体育app下载 澳门百丽宫娱乐官网 188体育平台规则 下载牛牛送金币 AG真人最新版APP 在线真人国际 app世界杯投注 线上最大的赌场 天博app官网入口下载 im体育官网APP 狗万官网 云鼎手机登录 亿万先生手机版下载 澳门皇冠你值得网页地址 电子老虎机娱乐 球探手机比分网足球 365体育中文 九州体育手机客户端注册 亚洲顶级线上娱乐场 万博网址是多少 世界杯买球app下载 必博体育官网登录入口 obao体育 沙巴sb体育官网首页 三元官方正规下载 最新送彩金网址论坛 澳门皇冠http 申博苹果版 投注类赌博 ag有名的平台 线上平台彩票 新宝gg快速登陆 欧宝手机APP 亚洲城真人 888真人登陆 manbetx万博网 娱乐抢庄牛牛棋牌游戏 宝赢体育 12bet娱乐官网 彩票体验金 IM体育app 火狐下载地址 摩登彩票平台登陆 澳门真人银河国际 威利斯人娱乐棋牌网站 环球电竞 澳门电玩登录 2026俄罗斯世界杯投注 电竞怎么压钱 EDF在线 牛牛游戏注册 亚洲赌场网址 GPK老虎PP电子试玩 18luck新利 六合神龙 球探网足球即时比分球 梦幻国际 真人 幸运国际 佛祖禁肖图 威尼斯体育官网 世界杯买球的app排行榜 大富豪网站App 世界杯投注方法 澳门新葡亰登入 棋牌娱乐 外围足彩网站有哪些 新宝网址 欧洲杯时间表
    热门网络工具