ag平台下载,专为热爱品质生活的你打造,每一次点击都是新的惊喜_新万博体育
ag平台下载 最近更新|更新列表|字母检索|下载排行|苹果专区|分类导航

当前位置:首页电脑软件法硕国家线 → ag平台下载 v3.401.8818 安卓漢化版

ag平台下载

ag平台下载

  • 电脑版下载
猜你喜欢
标签: ag平台下载 英皇国际网站
详情
介绍
猜你喜欢
相关版本

ag平台下载截图Q8X2R7L1T4J5M9B6W3

内容详情

ag平台下载

VLA(Visual-Language-Action)大模型到底能跑多快?在这篇 RT-VLA(Real-time VLA)论文中,来自 Dexmal 原力灵机(由范浩强等人联合创立的具身智能公司)的研究者公布了一个反直觉的发现:它可以非常快!

具体而言,对于常用的 Pi0 级别的模型(30 亿参数),在单张消费级显卡 RTX 4090 上最快可以跑到 30fps。这和大家对于 VLA 模型动辄要几十甚至上百毫秒的刻板印象形成鲜明对比。

为实现这点,研究者深入分析 Pi0 的模型结构,通过一系列优化把用时从开始的 100+ ms 进行数倍缩减(针对双视角,甚至已经达到 27ms),显著强于 openpi 里采用的基于 jax 的自动优化的结果。

此外,研究者基于现有结果探讨了未来的“实时”运行的 VLA 结构,设计出一个有潜力最高实现 480Hz 闭环控制的算法框架。目前,优化后的代码已在 GitHub 开源,全部实现均打包为一个只依赖于 torch 和 triton 的单一文件,大家可在自己的项目里 “开箱即用”。这是Dexmal 原力灵机继开源一站式 VLA 工具箱 Dexbotic之后的又一开源代码工作。

论文名称:Running VLAs at Real-time Speed论文链接:https://arxiv.org/abs/2510.26742GitHub:https://github.com/Dexmal/realtime-vla

解决什么痛点?

现在机器人 VLA 大模型动辄几十亿参数,虽然有不错的泛化能力,但是延迟问题总是绕不过。即使是在高端推理显卡上,高达百毫秒级别的推理时间让机器人的实时控制困难重重,就像一个人看见东西后要愣一下才做出动作。

如果我们能够把模型运行到和相机一样快的频率(25fps、30fps 甚至 50fps),那么就可以在完全不丢帧的情况下处理视觉信息,让 VLA 模型的实时运行成为可能。

如何实现?

Pi0 模型计算流程图示,它主要包括 1 个视觉编码器,1 个编码器和 1 个解码器;所有这些又可进一步分解为一系列的矩阵乘法和标量运算。

对于 Transformer 这类模型,当它进行单次推理(比如只处理一个问题或一张图片)时,其内部计算过程实际上是由一长串零碎的 “矩阵计算小任务” 组成;而像 Pi0 这种采用 “流匹配” 技术的模型,需要反复迭代十次才能得出最终结果,每一次迭代本身就包含几十层计算。这样算下来,整个推理过程涉及数百层、上千个操作。任务如此零碎,让计算优化变得异常困难。

本文研究者通过深入分析模型推理过程中的计算问题,融合和并行优化每一个计算步骤,清除了推理方面的大部分障碍,再加上其他方面的优化,最终把整个 VLA 模型跑进了所需的时间之内。

这就像给了 VLA 大模型一份 “高性能 AI 大脑调校指南” ;它通过一系列深入的底层优化,把笨重的 AI 大模型变成能跑实时任务的 “闪电侠”,并在此基础上,构想出一个能同时具备条件反射、视觉反馈和智能思考的下一代机器人控制系统。

效果展示

上图所示的任务是抓取一支自由下落的笔。 这个任务对反应时间的要求极为苛刻。机器人观察到笔开始下落后,必须在极短的时间内做出反应并在正确的时间启动抓取动作,快一点或者慢一点都会导致任务失败。

最终呈现的效果是 从 “看到笔” 到 “执行抓取” 的端到端总反应时间被缩短到 200 毫秒以内,这大概对应到一个 30 cm 左右的最短下落距离。而人类在这个任务上的一般表现也不过如此。

下一步规划

基于上述取得的成果,研究者设计了一套完整的、围绕 GPU 打造的机器人控制框架,它能驱动 VLA 大模型,像 “直播” 一样对机器人进行流式的实时控制,让机器人拥有 3 种不同速度的 “反应神经”:

超快反应(480Hz):处理来自力传感器等高速信号。就像你的手一碰到烫的东西会瞬间缩回,不需要经过大脑思考。这部分由模型的 “解码器” 负责,能每秒生成 480 次控制指令。视觉反应(30Hz):处理来自摄像头的画面。就像你看着球飞过来,用眼睛跟踪并判断落点。这部分由模型的 “编码器” 负责。智能思考(<1Hz):处理语言理解和任务规划。就像你在执行任务时,还能分心听一下队友的指令或者自己琢磨一下策略。这部分速度最慢,但赋予了机器人更高的智能。

通过分析与实验,这个框架下一步规划最高能以 480Hz 的频率生成机器人控制信号;这个速度,已经摸到了实现基于力反馈进行控制的门槛。

未来展望

机器人有没有可能达到 “又聪明又快” 的效果?这篇文章只是一个起点。针对未来不断增加中的边缘计算算力,研究者展望了更进一步的可能性:

“眼睛” 最快能有多快?从 30fps 到 60fps,甚至 120fps,是否有新万博体育:的任务变得可行?“大脑” 最大能有多大?在实时性约束下,我们是否可以从 3B 模型,走向 7B,13B 模型,甚至更大模型?“反应” 速度的极限在哪里?在 VLA 框架下,我们是否还可以建立亚毫秒、甚至微秒级的反馈回路?

从这篇文章出发,一个能够参与实时控制 VLA 的世界的大门正在被打开。

相关版本

    多平台下载

    查看所有0条评论>网友评论

    发表评论

    (您的评论需要经过审核才能显示) 网友粉丝QQ群号:766969941

    查看所有0条评论>>

    相关软件
    球探ios下载 世博体育app下载苹果 怎么投注世界杯app 乐鱼安卓版下载 韦德体育网址是多少 网上下围棋 世界杯下单网站有哪些 斗牛棋牌游戏大厅 伟德网页版下载官网 谁有万博的网址 188宝金博手机版登陆 二八杠游戏注册 火狐体育苹果版下载 大发888体育外围 欧宝app平台 开云app平台 e世博手机版注册 真金娱乐场 凯发娱乐登陆界面在哪里 欧亿体育下载 雷速体育app官方下载ios 欧宝赌场网站 网赌官网 彩票体验金官网 俄罗斯世界杯投注资金 千赢国际真人 皇冠app下载安卓版 真钱诈金花下载 火狐官网网址 dafa登录 完美平台竞技app 亚娱体育 世界杯在哪买球啊 yobo网站 新澳门游戏城备用 哪里真人CS离麓山国际近 皇冠体育奥门 鸭博官网app 奥门新匍京网址是多少 世界杯买球appbs18典me 江南官方体育网站 欧洲杯下载 线上真钱银河网站信誉入口 马经挂牌系列A MG电子app官方 威尼斯人登录界面在哪里 皇冠体育首页官网 心博天下快速登陆 bob88体育平台提现不了 乐鱼投注登录 雷速体育下载2022 游戏厅捕鱼技巧 威尼斯人网站官网下载 澳门新葡亰总站 棋盘游戏平台 巴黎人电玩赌博 皇冠国际官方娱乐 欢斗地主下载免费下载 必博体育平台怎么样 米6官网下载 yabo22vip手机版登陆 亚愽体育 365在线体育平台 最新开的棋牌平台 六合财经A加大版 新萄京娱乐场官网 云顶娱乐网页手机版官网 杏彩客户端app 葡京体育注册App 新普京在线 欧宝体育官网入口 最好的体育平台是哪个 网球体育188 qy88千赢国际网页手机登录 永乐国际乐在其中F66 亚星体育外围 乐发彩票 欧足联官网 英亚体育官网注册 彩神彩票登录平台 威尼斯出款成功 多宝世界杯买球 万博官网地址是什么 开元app下载官网下载 mg平台网址多少 野马平台网页登录 博天堂外围官网 英雄联盟外围投注 世界杯足彩投注平台 马经奇迹B(新图推荐) 从哪里投注世界杯 完美体育网址入口 凯发娱乐网页版注册登录 九游会网页版官网 澳门永利体育 球探比分体育 亚美am8 乐虎国际怎么注册 米乐全站APP 188体育APP首页 18luck客服 qy115vip 千赢国际 国际象棋真人版游戏 雷速体育在线客服 世界杯买球数 排球比分网即时比分 凯发娱乐官网主页入口 手机购彩票平台 乐虎国际官网地址 世界杯投注碘fc3·tv 世界杯买球as83典me 欧宝体育官方下载 江南游戏社官网首页 升博开户网址 球探比分即时足球比分手机 威尼斯现金网 亚洲bet356手机版网址 云顶集团游戏平台 皇冠体育app下载安装 乐鱼在线试玩
    热门网络工具