(6秒完整指南)新濠博亚官方网站电脑版v84.36.56.59.78.13.843.87-2265安卓网_新万博体育
新濠博亚官方网站 最近更新|更新列表|字母检索|下载排行|苹果专区|分类导航

当前位置:首页电脑软件云台山男妲己演员停演3天后复出 → 新濠博亚官方网站 v8.277.2905.173458 PC版

新濠博亚官方网站

新濠博亚官方网站

  • 电脑版下载
猜你喜欢
标签: 新濠博亚官方网站 美高梅官方平台
详情
介绍
猜你喜欢
相关版本

内容详情

新濠博亚官方网站

本文第一作者为四川大学博士研究生刘泓麟,邮箱为tristanliuhl@gmail.com,通讯作者为四川大学李云帆博士后与四川大学彭玺教授。

一张图片包含的信息是多维的。例如下面的图 1,我们至少可以得到三个层面的信息:主体是大象,数量有两头,环境是热带稀树草原(savanna)。然而,如果由传统的表征学习方法来处理这张图片,比方说就将其送入一个在 ImageNet 上训练好的 ResNet 或者 Vision Transformer,往往得到的表征只会体现其主体信息,也就是会简单地将该图片归为大象这一类别。这显然是不合理的。

图 1:传统表征学习(上)与条件表征学习(下)的比较。传统的表征学习方法只能学习到一种通用的表征,忽略了其他有意义的信息;文章提出的条件表征学习能够基于指定准则,得到该准则下表现力更强的条件表征,适应多种下游任务。

此外,在各大电商平台,用户通常根据不同的标准(例如颜色、材质或场合)搜索商品。例如,用户今天可能搜索 “红色连衣裙”,明天搜索 “正装”,后天搜索某个全新的关键词。这对于拥有庞大规模商品的平台来说,手动打标签是不现实的,而传统的表征学习也仅仅只能获取到 “连衣裙” 这个层面的信息。

要获取图片中除了 “大象”、“连衣裙” 之外的信息,一个很容易想到的方法就是进行针对性的有监督训练:基于不同的准则比如环境,进行额外的标注,再从头训练或者基于已有表征训练一个额外的线性层。但是基于这种方式,显然是 “治标不治本” 的。因为一旦有了新的需求,便又需要进行针对性的数据收集、标注和训练,需要付出大量的时间和人力成本。

很幸运的,我们处在多模态大模型的时代,这个在以前可能会很困难的问题在今天是有很多解法的。我们可以直接通过询问 LLaVA,它便会告诉我们图片在指定准则下的信息。但这种方式也还不够高效,至少在 2025 年的今天,多模态大模型的使用成本还是需要考虑的。如果需要处理 ImageNet 之类的大规模数据集或者电商平台繁杂的商品,得到其在指定准则下的信息,这个开销就比较大了。所以对大多数人来说,现如今要获取图片的多维信息,还是需要找到一个更加高效的方法。

论文标题:Conditional Representation Learning for Customized Tasks论文链接:https://arxiv.org/abs/2510.04564代码链接:https://github.com/XLearning-SCU/2025-NeurIPS-CRL

方法

我们知道,对于三维直角坐标系,一组基,比如 [(1, 0, 0), (0, 1, 0), (0, 0, 1)],其线性组合即可构建出该坐标系中的任何向量。类似的,对于颜色体系,只需要 “红”、“绿”、“蓝” 三原色即可调出所有的颜色。

受此启发,我们想到,是否对于任意一个给定的准则,也存在着一个对应的 “概念空间” 及其基?如果能在这个空间中找到一组基,那么我们只需要将原始表征投影到该空间上,理论上就能获得在该准则下更具表现力和判别性的特征。

找到给定准则对应的基,这听起来有些困难。但没关系,我们不需要很准确地找到,只需要接近它就好。

基于这个想法,论文提出了一种即插即用的条件表征学习方法。如图 2 所示,给定准则(例如 “颜色”),CRL 首先让大语言模型 LLM 生成该准则相关的描述文本(例如 “红色”,“蓝色” 和 “绿色” 等)。随后,CRL 将由 VLM 得到的通用图片表征,投影到由描述文本张成的空间中,得到该准则下的条件表征。该表征在指定的准则下表达更充分,并且具有更优的可解释性,能有效适应下游定制化任务。

图 2:所提出的条件表征学习(CRL)的总体框架。图中以通用表征空间(准则为隐式的 “形状”)转换到 “颜色” 准则空间为例。

直白地说,只需要将对齐的图片和文本表征,做个矩阵乘法就好了,甚至不需要训练。复现难度约等于:

实验

分类和检索任务是衡量表征学习性能的两个经典下游任务。论文在两个分类任务(少样本分类、聚类)和两个检索任务(相似度检索、服装检索)上进行了充分的实验验证,部分实验结果如下:

图 3:分类任务

表 1:所提出的 CRL 在少样本分类任务上的性能。

表 2:所提出的 CRL 在聚类任务上的性能。

图 4:相似度检索任务。上为 “Focus on an object”(Focus),下为 “Change an Object”(Change)。

表 3:所提出的 CRL 在相似度检索任务上的性能。

图 5:服装检索任务。

表 4:所提出的 CRL 在服装检索任务上的性能。

从上述结果中可以看出, CRL 可以作为一个即插即用的模块,与现有多模态方法相结合,在不同准则下,其得到的条件表征在下游任务中都取得了比原表征更加优异的表现,性能甚至超过了对应领域的专用方法。新万博体育:实验可参见论文。

总结

与传统的表征学习只得到单一的通用表征不同,本文提出了条件表征学习,通过获取指定准则下的文本基,并将图像表征投影到该文本基张成的空间中,即可得到该准则下表现力更强的条件表征,以更好地适应各种下游任务。

相关版本

    多平台下载

    查看所有0条评论>网友评论

    发表评论

    (您的评论需要经过审核才能显示) 网友粉丝QQ群号:766969941

    查看所有0条评论>>

    相关软件
    网上葡京游戏 星速下载app官方 大发入口 im体育在哪开户 盛世棋牌官网最新 足球直播吧 raybet雷竞技竞猜app AG网上娱乐 威尼斯人手机端官网登录 亚投彩票平台 大发888手机版注册 jxf官方登录 凯时k66体育 刘伯温料 im体育外围下载 MG真人网址是多少 97娱乐平台官网我登录过的网站 炸金花软件来真钱的 线上真人国际娱乐 和记娱乐真人投注 欧宝体育在线登陆 尊龙凯时官网网址 蓝湾国际真人娱乐 反水高的网投平台 正规真人龙虎靠谱平台 澳门真人娱乐游戏 万赢娱乐网站正式版 凤凰彩票平台登陆网址登录 八牛斗地主app 博狗买球网 万博网址登录 乐动体育平台网址 sa视讯 kaiyun登录入口登录官网 澳博体育app下载 环球客户端下载 中体比分 立博体育外围 中国竞彩网世界杯投注 KU游娱乐客服入口 米乐官网注册 必赢官网买球 米乐在线买球 永利线上娱乐场官网登陆 世界杯投注量在哪里看 篮球世界杯去哪里投注 澳门金凰78903com 球探比分雷速体育 博天堂好玩吗? 世界杯足球开户 欧亿平台官网 欧博可靠吗 中国麻将 AG注册平台免费下载 银河游戏中心下载 免费斗牛牛软件 ayx爱体育官网 美高梅在线娱乐 日博体育移动版 十大网堵老平台 萄京国际电子游戏 尊龙竞彩官网 kai云体育app官方下载APP 九州直播视讯 另版海狮特码内幕报 新浪彩票世界杯投注 ManBetx在线注册 万博官网manbetx登录注册 kok新版中欧体育入口 真人斗地主国际版 10bet网站 澳门万利平台 千赢国际备用网址 亿博体育网址 博雅德州安卓版 杏彩登陆平台 杏耀app官网 线上巴黎人网投 每天3元救济金斗地主 捕鱼王官网 百老汇官方app 真钱二八杠上seo大牛优化 OD世界杯买球 沙巴体育投注英超联赛欧冠 新二网皇冠手机 明陞体育备用网址 澳门在线官方 世界杯买球app入as83殿me 手机版端丰国际移动端 二八杠怎么认牌大小 凯发误乐真人版 世界杯买球能赚多少 银河正规中心 AG真人国际 足球开户 手机赌钱官网 云顶娱乐体验app 怎么看世界杯投注情况 威尼斯人登陆界面在哪里 财经时报 赌博app大全下载 网络赌平台有哪些 澳门永利集团的网址是多少 hth华体会在线买球 乐鱼app在线 tyc导航网站 亿博体育 那个网站可以买世界杯 mg网址 博狗体育直播 新开国际真人娱乐 贝博ballbet体育官网登录 贝搏体育 诚信彩票平台下载 澳门星际官网网站下载 MG视讯充值就送 世界杯投注如何玩 澳门威斯尼斯人442 杏鑫官网注册 麻将二八杠怎么赢
    热门网络工具