全球权威评测榜单BIRD:蚂蚁数科超越谷歌等公司位居第一
9月26日,据全球权威评测基准BIRD-Bech官网,蚂蚁数科的数据分析智能体Agentar-SQL超越AT&T(美国电话电报公司)、谷歌云、腾讯云、阿里云等诸多国内外厂商,位居全球第一。这也是中国公司在该榜单上取得的最高成绩。
BIRD-Bench是公认的全球最具权威性的自然语言转SQL评测基准,要求AI大模型将自然语言查询转换为结构化查询语言(SQL),并且在真实复杂的大规模生产级数据库中稳定执行。BIRD--Bench数据集覆盖金融、电力、医疗等37个行业场景,总量33GB,包含超过1万条高复杂度查询任务,是全球顶级AI团队展示技术实力的权威平台。
值得一提的是,蚂蚁数科Agentar-SQL在BIRD榜单的执行准确率排行榜(81.67分)以及执行效率榜上(77分)上均取得第一的成绩。这意味着蚂蚁数科在智能问数领域的技术创新实现全球领先。
据介绍,Agentar-SQL智能体基于蚂蚁数科的SQL大模型Agentar-Scale-SQL构建,旨在让用户可以通过自然语言轻松完成复杂的数据查询任务。它通过GSPO(组序列策略优化)强化学习训练方法,能够增强SQL内在推理,让大模型在推理阶段,深度思考SQL框架,避免潜在的逻辑错误,提升SQL逻辑准确性;此外,Agentar-SQL具备多轮反思修正的能力,让模型对生成的SQL进行多轮次的审视和修正,提升SQL语言的精准性;Agentar-SQL还通过独创的两阶段生成法,让大模型生成多个SQL候选,再对SQL进行两两PK的“锦标赛”,筛选出最优的SQL。
蚂蚁数科持续深耕AI大模型技术与应用,此前其自研的金融推理大模型Agentar-Fin-R1,在多项主流金融基准测试实现领先。专为新能源行业定制的能源电力垂类时序大模型在行业评测集上的发电量预测准确率超越谷歌(TimesFM-V2.0)、亚马逊(Chronos-Large)等行业主流的通用时序模型。
相关推荐:188体育平台注册登录 皇冠即时分 ku娱乐真人体育平台客服
优发国际网官网在线
雷竞技电竞
365betapp体育最新手机版
星际娱乐场网址多少
b体育平台下载官网
赌博线上
欧宝平台入口
emc体育网页版
u乐娱乐国际网站
伟德投注
九游官网客服
博彩导航旗舰站
线上网投官网
AG真人接口MG接口API
博亚体育官网登陆
366体育博彩
AG登录
白菜网址大全
永利网站官网首页
万博手机APP
KK体育平台跑路了
利来国际真人娱乐老牌
果博游戏登录
千亿国际手机官网下载
沙滩排球3
大刀皇(新料)
k7娱乐国际娱乐真人
金苹果娱乐平台登录
天博综合平台登录
火狐买球
亚美体育下载
6UP扑克之星游戏注册
365bet客户端官网下载
大红鹰葡京会
三国真人国际棋牌
ob欧宝官网下载
威尼斯人官网网页
撲克王下载二维码
大富豪官方下载地址
线上直营现金网站
kb88凯时手机网页版登录入口
bet新地址
彩神彩票官网app
炸金花不要钱
欧宝可靠吗
AG金拉霸800倍游戏论坛
188bet体育在线滚球
米乐体育官方版下载
lovebet爱博网页版
新万博manbetx
金沙棋牌
beat365体育
银河游戏网站是多少
1384太阳城网址
188bet体育下载
bet8体育下载app
海尔网址导航
球探比分直播手机
pg电子体验金模式
诈金花在线玩
澳门九五至尊官网
365体育bet下载
乐竞体育官网登录
365体育
皇冠体育365官网app
太阳城游戏链接
AG亚洲国际游戏网址
365bet客户端
体育投注注册送
印尼分分彩
凯时国际app娱乐
皇冠娱乐从搜博网开始
综合体育平台有哪些
10bet注册
开博体育官方
金沙游戏老版
必赢网址手机主页
网上买球app苹果版
AG亚洲游戏国际平台网址
九龙内幕
MG电子官网登录
网友评论 查看所有评论>>