全球权威评测榜单BIRD:蚂蚁数科超越谷歌等公司位居第一
9月26日,据全球权威评测基准BIRD-Bech官网,蚂蚁数科的数据分析智能体Agentar-SQL超越AT&T(美国电话电报公司)、谷歌云、腾讯云、阿里云等诸多国内外厂商,位居全球第一。这也是中国公司在该榜单上取得的最高成绩。
BIRD-Bench是公认的全球最具权威性的自然语言转SQL评测基准,要求AI大模型将自然语言查询转换为结构化查询语言(SQL),并且在真实复杂的大规模生产级数据库中稳定执行。BIRD--Bench数据集覆盖金融、电力、医疗等37个行业场景,总量33GB,包含超过1万条高复杂度查询任务,是全球顶级AI团队展示技术实力的权威平台。
值得一提的是,蚂蚁数科Agentar-SQL在BIRD榜单的执行准确率排行榜(81.67分)以及执行效率榜上(77分)上均取得第一的成绩。这意味着蚂蚁数科在智能问数领域的技术创新实现全球领先。
据介绍,Agentar-SQL智能体基于蚂蚁数科的SQL大模型Agentar-Scale-SQL构建,旨在让用户可以通过自然语言轻松完成复杂的数据查询任务。它通过GSPO(组序列策略优化)强化学习训练方法,能够增强SQL内在推理,让大模型在推理阶段,深度思考SQL框架,避免潜在的逻辑错误,提升SQL逻辑准确性;此外,Agentar-SQL具备多轮反思修正的能力,让模型对生成的SQL进行多轮次的审视和修正,提升SQL语言的精准性;Agentar-SQL还通过独创的两阶段生成法,让大模型生成多个SQL候选,再对SQL进行两两PK的“锦标赛”,筛选出最优的SQL。
蚂蚁数科持续深耕AI大模型技术与应用,此前其自研的金融推理大模型Agentar-Fin-R1,在多项主流金融基准测试实现领先。专为新能源行业定制的能源电力垂类时序大模型在行业评测集上的发电量预测准确率超越谷歌(TimesFM-V2.0)、亚马逊(Chronos-Large)等行业主流的通用时序模型。
青鹏棋牌
bet365休育投注备用网站
澳门新葡亰平台官网下载
扑克王怎么下载
365体育app在线网站
6566体育平台app下载
jxf登录入口
下载单机斗地主
AG8COM
彩神彩票网站
云顶娱乐登录
百姓彩票网官网下载
火狐体育官网在线登录
赛马会内幕报(原创版)
凯发娱乐官方网站登陆
欧洲杯在哪下赌注
皇冠app下载装
im体育官网APP
澳门尼斯人游戏下载
3777金沙娱场城
万博网页版max
开元棋牌体育
天博综合官网
火狐体育手机版app下载
必威首页官网体育
ManBetX万博客服电话
威尼斯游戏网址大全nv8588
bet9官方网站
凯发娱乐手机端登录下载
澳门威尼斯登录
真人斗牛下载平台
im电竞可靠吗
j9com
二八杠怎么样才赢
ayx爱游戏手机登录
ROR开户网址
乐鱼在线登录
宝博在线开户
ag真人官网
体球网官网首页
体育投注网站app
开云体育官网入口网页登录
尊龙官网免费下载
东方体育网
m6米乐app官方
伟德在线开户
新宝6注册线路
金沙网址多少
皇冠hg0086地址
国际音标真人发音
泛雅平台
正规真人龙虎靠谱平台
安博体育电竞下载
三星发财报(新图推荐)
亚美优惠永远多一点
威尼斯人手机版网页登陆
万博手机版max网页版主站
必发世界杯内幕
米乐开户网址
ag官方下载
土地公特码报A
vwin德赢在线登录
沙龙国际真人
太阳集团所有网址138
美高梅线上电子
手机赌钱现金
ope体育电竞官网首页
乐赢棋牌
大奖快3全天计划
体育投注app排行
365买球能用吗
天博网页版登陆
葡京手机娱乐app
必发手机版登录
tbh6666腾博会
国际真人视频娱乐AG
九游会官网网址是多少
宝马会平台
大发体育竞彩官网
凤凰彩票足球
亚盈App
网友评论 查看所有评论>>