当前位置:首页 → 电脑软件 → 工厂请千名工人吃1吨龙虾西瓜 → 18岁禁止黄片 v6.134.5739 安卓版
v4.294.779.6783 最新版
v4.785.1128.224833 安卓版
v7.92.1334 安卓免費版
v6.236.164.897382 PC版
v6.892.8023.403369 IOS版
v7.67.7401.949232 安卓免費版
v1.240.9899.912546 安卓免費版
v7.589.6945.983290 最新版
v4.365 安卓版
v6.291.1689.338263 安卓漢化版
v8.24.7559.81300 IOS版
v3.866.484 最新版
v2.102.5110.372308 安卓最新版
v7.931.8675.522284 安卓版
v4.819.911.335563 安卓免費版
v5.789.5433.923867 安卓版
v4.638 最新版
v5.120.6530.894014 安卓免費版
v8.883.66 安卓免費版
v2.659.7870 最新版
v6.523.6661.93923 安卓最新版
v1.865.9167.771266 PC版
v8.121.3938 安卓最新版
v7.673.1948.515231 IOS版
v8.948.5626.314276 最新版
v6.832.5326.650403 安卓免費版
v6.961.3943.988808 安卓最新版
v3.233.4160.655178 安卓版
v9.173.7861.444097 安卓漢化版
v6.982.4809.632405 IOS版
v6.163.3189.536527 安卓免費版
v1.118.5865.613596 安卓版
v8.372.2401 安卓免費版
v9.571.7435.46368 PC版
v1.637.6751 安卓免費版
v9.107 安卓版
v4.860.2041.794645 最新版
v1.616.2968 PC版
v4.298.7708.190521 安卓版
v4.513.8091.734889 最新版
v7.732.2280.879014 最新版
v5.985.2296.423326 PC版
v7.959 最新版
v1.819.3810.782996 安卓免費版
v1.623 安卓漢化版
v3.127 安卓最新版
v7.986.7058.714688 IOS版
v4.730.9976.662826 安卓版
v1.943 PC版
v9.597.4226.407980 PC版
v4.329.228.674490 安卓漢化版
v6.592.7010.666183 PC版
v3.913.4209 安卓漢化版
v9.659 安卓免費版
v1.413 最新版
v6.39.3243.171477 最新版
v2.590.4980.767409 PC版
v3.395.5011.972549 最新版
v8.66.8905.824112 安卓漢化版
v5.57.5893.154404 PC版
v9.301 安卓版
v4.213 PC版
v5.812 安卓漢化版
v5.716.6208.157577 IOS版
v4.175.9735.8546 安卓最新版
v8.485.1022.671932 安卓版
v1.854.5996.548042 安卓漢化版
v7.446 安卓版
v2.642.555 安卓免費版
v2.202.9564.483700 IOS版
v3.476.8206 IOS版
v2.351.9596 最新版
v6.605.826.289509 IOS版
v2.407.4658.544655 最新版
v4.143.932.25742 PC版
v7.41.4595.587444 安卓版
v2.552 IOS版
v7.102.9036.816960 安卓免費版
v3.369.8133.91536 安卓最新版
v7.23.8351 安卓漢化版
18岁禁止黄片
全球头部开源模型方的共同选择,印证了一款底层框架的硬实力。趋境科技与清华共同开源的KTransformers,已成为Qwen、Kimi、智谱AI等多个主流大模型发布首日的推荐推理引擎,其工程实践与兼容性也被多家一体机产品线采纳,成为被开发者、厂商与开源社区广泛复用的共建式底层框架。
技术与生态双认可:成功入选 “计算机系统领域奥斯卡” SOSP 2025
KTransformers 是一个高性能异构推理框架,专注于高效利用底层 GPU、CPU、内存等多样化算力,让大模型在更低算力、更灵活的硬件架构上高效运行。其论文《KTransformers: Unleashing the Full Potential of CPU/GPU Hybrid Inference for MoE Models》成功入选 “计算机系统领域奥斯卡” SOSP 2025,该顶会过去几十年间见证了虚拟化、分布式文件系统等无数里程碑式技术成果的首次亮相,此次入选标志着 KTransformers 的技术实力获得全球顶尖认可。
11月6日,月之暗面发布Kimi-K2-Thinking 模型后,KTransformers迅速完成全面适配,支持用户在单卡环境下完成推理任务,2卡环境下完成LoRA微调任务,大幅降低部署与定制化门槛。同时,趋境科技也已完成该模型在昇腾NPU上的全面适配,提供完善的全国产化推理解决方案,进一步拓宽其应用场景。
推理与微调双高效:KTransformers+SGLang实现高性能推理部署
在推理部署层面,KTransformers与主流推理框架SGLang于10月达成合作,双方架构合入同一分支。在Kimi-K2-1TB的模型推理任务中,用户仅需简单安装SGLang与KTransformers CPU内核,下载官方模型及量化权重,即可通过一条命令启动服务,且仅需单张消费级 GPU+CPU。这一合作融合了GPU+CPU异构推理创新模式与全GPU传统推理模式,推动大模型推理向更高性能、更低成本演进,迈向更广泛的产业落地。
在微调部署层面,KTransformers与LLaMA-Factory深度集成,支持LoRA等轻量级微调方法,仅占用约41 GB显存+2T内存,就能实现46.55 token/s的微调吞吐量。传统上,LoRA 微调千亿模型成本高达数百万,而趋境的异构微调能力将资源需求降低到单个消费级 GPU(如 RTX 4090)起,让高校、中小型实验室、初创公司甚至个人开发者都能参与大模型定制。该方案在 DeepSeek-14B 模型上展现了超过传统方案 1.8 倍的吞吐、显存占用降低 82%,是消费级显卡上微调超大参数 MoE 模型的唯一可行方案。
对趋境科技而言,KTransformers承载的是 “普惠顶尖AI智能与隐私” 的价值理念。大模型时代需要更广谱的推理基础设施路线,趋境已与多个国产 CPU、GPU硬件平台合作,推进全国产高性价比方案;为数十家行业开发伙伴提供算力底座,让新万博体育:团队用得起、调得动大模型。今天的KTransformers,已让大模型推理脱离高端算力垄断;未来,趋境将继续推动 AI 能力普惠,让大模型真正融入各类业务场景。
相关版本
多平台下载
查看所有0条评论>网友评论