嗯∽啊～轻点禁🔞揉胸国产Agentic Coding表{现创新高，全新}KAT系列模型强势霸榜SWE-Bench

Ê×Ò³ >ÐÂÎÅ >Éç»áÐÂÎÅ

Agentic Coding±íÏÖ´´ÐÂ¸ß£¬È«ÐÂKATÏµÁÐÄ£ÐÍÇ¿ÊÆ°Ô°ñSWE-Bench

2025-09-20 18:39:13

À´Ô´£º

Ã¨ÑÛµçÓ°

×÷Õß£º

蒋劲夫

ÊÖ»ú²é¿´

¡¡¡¡Ã¨ÑÛµçÓ°¼ÇÕß 林凯 ±¨µÀP6F3X2M7T9QJ8L1B4WZR

½üÆÚ£¬¿ìÊÖ Kwaipilot ÍÅ¶ÓÍÆ³öÁËKAT ÏµÁÐÁ½¿îÍ»ÆÆÐÔ Agentic Coding ´óÄ£ÐÍ¿ªÔ´ 32B ²ÎÊýÄ£ÐÍ KAT-Dev-32B±ÕÔ´Æì½¢Ä£ÐÍ KAT-Coder

ÕâÁ½¿îÄ£ÐÍÔÚ Code Intelligence ÁìÓò·Ö±ðÌåÏÖ³öÇáÁ¿¼¶µÄ³¬Ç¿±íÏÖºÍ¼«ÖÂÐÔÄÜ¡£ÆäÖÐ£¬ÔÚ SWE-Bench Verified ÉÏ£¬KAT-Dev-32B Õ¹ÏÖ³öÇ¿¾¢ÐÔÄÜ²¢È¡µÃÁË 62.4% µÄ½â¾öÂÊ£¬ÔÚËùÓÐ²»Í¬¹æÄ£µÄ¿ªÔ´Ä£ÐÍÖÐÅÅÃûµÚ 5¡£Óë´ËÍ¬Ê±£¬KAT-Coder ÒÔ 73.4% µÄ½â¾öÂÊÔÚ SWE-Bench Verified ÉÏÈ¡µÃÁË¼«¼ÑµÄµ¥Ä£ÐÍ±íÏÖ£¬±È¼çÈ«Çò¶¥¼â±ÕÔ´Ä£ÐÍ¡£

Í¼ 1£ºÔÚ SWE-Bench Verified ÉÏ£¬ºÍÈ«³ß´ç¿ªÔ´Ä£ÐÍ¶Ô±È£¬KAT-Dev ÓÃ¼«Ð¡µÄÄ£ÐÍ³ß´çÈ¡µÃÁËµÚÒ»ÌÝ¶ÓµÄÐÔÄÜ

Í¼ 2£ºÔÚ SWE-Bench Verified ÉÏ£¬KAT-Coder È¡µÃ¼«¼ÑµÄµ¥Ä£ÐÍ±íÏÖ£¬±È¼çÈ«Çò¶¥¼â±ÕÔ´Ä£ÐÍÐÔÄÜ

Ä£ÐÍ¿ªÔ´ºÍ API ¿ª·Å

KAT-Dev-32B ÒÑÔÚ¿ªÔ´Ä£ÐÍÍÐ¹ÜÆ½Ì¨ Hugging Face ÉÏÏß£¬¿É¹©½øÒ»²½ÑÐ¾¿ºÍ¿ª·¢Ê¹ÓÃ¡£KAT-Coder Ä£ÐÍµÄ API ÃÜÔ¿½üÆÚÒ²ÔÚ ¡°¿ìÊÖÍòÇæ¡± ÆóÒµ¼¶´óÄ£ÐÍ·þÎñÓë¿ª·¢Æ½Ì¨ÉÏ¿ª·ÅÉêÇë£¬ÓÃ»§½«ÄÜ¹»Í¨¹ý Claude Code µÈ¹¤¾ßÖ±½Ó·ÃÎÊ²¢½øÐÐ±àÂë¡£

¿ìÊÖ Kwaipilot ÍÅ¶ÓµÄ¹Ù·½¼¼Êõ Blog£ºhttps://kwaipilot.github.io/KAT-Coder/KAT-Dev-32B Ä£ÐÍ¿ªÔ´µØÖ·£ºhttps://huggingface.co/Kwaipilot/KAT-DevKAT-Coder ¿ª·¢¹¤¾ß½ÓÈëÖ¸ÄÏ£ºhttps://www.streamlake.com/document/WANQING/me6ymdjrqv8lp4iq0o9KAT-Coder API Key ÉêÇë£ºhttps://console.streamlake.com/wanqing/

ºËÐÄ¹±Ï×µãÕªÒª

KAT-Dev-32B ºÍ KAT-Coder ÔÚ¶à¸öÑµÁ·½×¶Î½øÐÐÁË´´ÐÂºÍÓÅ»¯£¬°üÀ¨ Mid-Training ½×¶Î¡¢¼à¶½Î¢µ÷ (SFT) ½×¶Î¡¢Ç¿»¯Î¢µ÷ (RFT) ½×¶Î£¬ÒÔ¼°´ó¹æÄ£ÖÇÄÜÌåÇ¿»¯Ñ§Ï° (RL) ½×¶Î£¬¾ßÌåÈçÏÂ£º

Mid-Training£ºKwaipilot ÍÅ¶Ó·¢ÏÖ£¬ÔÚÕâÒ»½×¶Î´óÁ¿Ôö¼Ó¹¤¾ßÊ¹ÓÃÄÜÁ¦¡¢¶àÂÖ½»»¥ºÍÖ¸Áî×ñÑµÄÑµÁ·£¬ËäÈ»ÔÚµ±Ç°½á¹ûÉÏ£¨ÀýÈçÔÚ SWE-bench µÈÅÅÐÐ°ñ£©¿ÉÄÜ²»»á´øÀ´ÏÔÖøµÄÐÔÄÜÌáÉý£¬µ«¶ÔºóÐøµÄ SFT ºÍ RL ½×¶Î¾ßÓÐÖØ´óÓ°Ïì¡£SFT & RFT£ºÍÅ¶ÓÔÚ SFT ½×¶Î¾«ÐÄ²ß»®ÁË°ËÖÖÈÎÎñÀàÐÍºÍ°ËÖÖ±à³Ì³¡¾°£¬ÒÔÈ·±£Ä£ÐÍµÄ·º»¯ÄÜÁ¦ºÍ×ÛºÏÄÜÁ¦¡£´ËÍâ£¬ÔÚ RL Ö®Ç°£¬´´ÐÂÐÔµØÒýÈëÁË RFT ½×¶Î£¬Ê¹ÓÃÈËÀà¹¤³ÌÊ¦±ê×¢µÄ "½ÌÊ¦¹ì¼£" ×÷ÎªÑµÁ·ÆÚ¼äµÄÖ¸µ¼¡£´ó¹æÄ£ Agentic RL£ºµ±Ç°£¬À©Õ¹ÖÇÄÜÌå RL ÃæÁÙÈý¸öÌôÕ½£º·ÇÏßÐÔ¹ì¼£ÀúÊ·µÄ¸ßÐ§Ñ§Ï°¡¢ÀûÓÃÄÚÔÚÄ£ÐÍÐÅºÅÒÔ¼°¹¹½¨¿ÉÀ©Õ¹µÄ¸ßÍÌÍÂÁ¿»ù´¡ÉèÊ©¡£¶Ô´Ë£¬Kwaipilot ÍÅ¶ÓÍ¨¹ý¶ÔÊý¸ÅÂÊ¼ÆËãµÄÇ°×º»º´æ£¨Log-Probability Prefix Caching£©¡¢»ùÓÚìØµÄ¹ì¼£¼ôÖ¦£¨Entropy-based Tree Pruning£©ºÍ×ÔÑÐµÄ¹¤Òµ¼¶¹æÄ£Ç¿»¯Ñ§Ï°ÑµÁ·¿ò¼Ü SeamlessFlow À´½â¾öÕâÐ©ÎÊÌâ¡£

KAT ÏµÁÐÄ£ÐÍµÄºËÐÄ¼¼ÊõÂ·Ïß

Ò»¡¢Mid-Training

Kwaipilot ÍÅ¶Ó¶Ô¾¹ýÔ¤ÑµÁ·µÄÄ£ÐÍ½øÐÐÁËÁ½½×¶ÎÑµÁ·£¬¸Ã½×¶Î±»³ÆÎª Mid-Training¡£ÔÚÆäÖÐµÄµÚÒ»¸ö½×¶Î£¬ÔöÇ¿ÁËÄ£ÐÍÓë ¡°LLM-as-Agent¡± Ïà¹ØµÄÈ«·½Î»ÄÜÁ¦£¬°üÀ¨µ«²»ÏÞÓÚÒÔÏÂ¼¸ÖÖÄÜÁ¦£º

¹¤¾ßµ÷ÓÃÄÜÁ¦£º¹¹½¨ÁËÔÚÉ³ºÐ»·¾³ÕæÊµÖ´ÐÐ¹¤¾ßµÄµ÷ÓÃ·½·¨ÒÔ¼°Ö´ÐÐ½á¹ûµÄ½»»¥Êý¾Ý£¬ÓÃÓÚÌáÉýÄ£ÐÍµÄ¹¤¾ßµ÷ÓÃÄÜÁ¦£»¶àÂÖ½»»¥ÄÜÁ¦£º¹¹½¨ÁË×î³¤Êý°ÙÂÖµÄÈËÀà¡¢Ä£ÐÍ¡¢¹¤¾ßµÄ½»»¥Êý¾Ý£¬ÓÃÓÚÌáÉýÔÚ³¤ÎÄ±¾Çé¿öÏÂÄ£ÐÍµÄ¶àÂÖ½»»¥ÄÜÁ¦£»±àÂëÖªÊ¶×¢Èë£º¼ÓÈëÁË¸ßÖÊÁ¿µÄÓë±àÂëÏà¹ØµÄÁìÓòÖªÊ¶Êý¾Ý£¬ÓÃÓÚ½øÒ»²½ÔöÇ¿Ä£ÐÍÔÚ±àÂë³¡¾°ÏÂµÄÐÔÄÜ£»Git Commit Êý¾Ý£º¼ÓÈëÁË´óÁ¿À´×ÔÓÚÕæÊµ Git ²Ö¿âµÄ PR Êý¾Ý£¬ÓÃÓÚ½øÒ»²½ÌáÉýÄ£ÐÍÔÚÕæÊµ±à³ÌÈÎÎñÏÂµÄ±íÏÖ£»Ö¸Áî¸úËæÊý¾Ý£ºÊÕ¼¯ÁË 30 + Àà³£¼ûµÄÓÃ»§Ö¸Áî£¬ÓÃÓÚÔöÇ¿Ä£ÐÍ¶ÔÓÃ»§Ö¸ÁîµÄÀí½âÄÜÁ¦£»Í¨ÓÃ¼°Ë¼¿¼Êý¾Ý£º¹¹½¨ÁË¶àÀàÍ¨ÓÃÊý¾Ý£¬ÓÃÓÚÔöÇ¿Ä£ÐÍÔÚÍ¨ÓÃÁìÓòÒÔ¼°ÔÚµ÷ÓÃ¹¤¾ßÊ±½øÐÐË¼¿¼µÄÄÜÁ¦¡£

¶þ¡¢¼à¶½Î¢µ÷ (Supervised Fine-Tuning, SFT)

ÔÚµÚ¶þ½×¶Î£¬Kwaipilot ÍÅ¶ÓÊÕ¼¯ÁË´óÁ¿ÈËÀà¹¤³ÌÊ¦±ê¼ÇµÄÕæÊµÐèÇó½»¸¶¹ì¼££¬²¢»ùÓÚ´ËºÏ³ÉÁË´óÁ¿µÄ¹ì¼£Êý¾Ý£¬½øÒ»²½¶ÔÄ£ÐÍ½øÐÐÑµÁ·£¬ÒÔÔöÇ¿Æä¶Ëµ½¶ËÐèÇó½»¸¶µÄÄÜÁ¦¡£ÆäÖÐ¸²¸ÇÁË¶àÖÖÈÎÎñÀàÐÍ£º

°Ë´óÓÃ»§ÈÎÎñÀàÐÍ£º

Feature Implementation£¨¹¦ÄÜÊµÏÖ£©Feature Enhancement£¨¹¦ÄÜÔöÇ¿£©Bug Fixing£¨È±ÏÝÐÞ¸´£©Refactoring£¨½á¹¹ÓÅ»¯£©Performance Optimization£¨ÐÔÄÜÓÅ»¯£©Test Case Generation£¨²âÊÔÓÃÀýÉú³É£©Code Understanding£¨´úÂëÀí½â£©Configuration & Deployment£¨ÅäÖÃÓë²¿Êð£©

°Ë´óÓÃ»§±à³Ì³¡¾°£º

Application Development£¨Ó¦ÓÃ¿ª·¢£©UI/UX Engineering£¨½çÃæÓëÓÃ»§ÌåÑé¹¤³Ì£©Data Science & Engineering£¨Êý¾Ý¿ÆÑ§Óë¹¤³Ì£©Machine Learning & AI£¨»úÆ÷Ñ§Ï°ÓëÈË¹¤ÖÇÄÜ£©Database Systems£¨Êý¾Ý¿âÏµÍ³£©Infrastructure Development£¨»ù´¡ÉèÊ©¿ª·¢£©Specialized Programming Domains£¨×¨Òµ±à³ÌÁìÓò£©Security Engineering£¨°²È«¹¤³Ì£©

Èý¡¢Ç¿»¯Î¢µ÷£¨Reinforcement Finetune£¬RFT£©

ÔÚÕâÒ»½×¶Î£¬Kwaipilot ÍÅ¶ÓÔÚÇ¿»¯Ñ§Ï°Á÷³ÌµÄ»ù´¡ÉÏ£¬¶îÍâÒýÈëÁË¶à¸ö ground truth ÓÃÓÚ¹ì¼£Ì½Ë÷µÄÖ¸µ¼£¬ÌáÉý rollout Ð§ÂÊ£¬´Ó¾ø¶Ô reward µ½ºâÁ¿Óë ground truth µÄ²îÒì£¬ÌáÉýÁËÇ¿»¯Ñ§Ï°½×¶ÎµÄÐ§ÂÊºÍÎÈ¶¨ÐÔ¡£

´ÓÖ±½Ó¸ø¶¨¾ø¶Ô reward ¸üÐÂÎªºâÁ¿ rollout Ñù±¾ºÍ ground truth Ö®¼äµÄÏà¶Ô²îÒì¸øÁËÇ¿»¯Ñ§Ï°¸üÎÈ¶¨ºÍ¸ü×¼È·µÄ½±ÀøÐÅºÅ£¬Í¬Ê±Ò²»áÔÚ rollout ½×¶ÎÊµÊ±¼à¶½Ñù±¾µÄÕýÈ·ÐÔ£¬²¢¼°Ê±ÖÕÖ¹Óë ground truth ÓÐÃ÷ÏÔÆ«ÀëµÄÑù±¾Éú³É£¬ÕâÒ²¸øÇ¿»¯Ñ§Ï°´øÀ´ÁË¸ü¸ßµÄÑù±¾Ð§ÂÊ¡£

Í¼ 3£ºÔÚÇ¿»¯Î¢µ÷£¨RFT£©Á÷³ÌÖÐ£¬ÒýÈë½ÌÊ¦¹ì¼£×÷ÎªÖ¸µ¼

¾¹ýÈý½×¶ÎµÄÑµÁ·£¬ÍÅ¶Ó»ñµÃÁËÎª RL ½×¶Î×¼±¸µÄÀäÆô¶¯Ä£ÐÍ£¬RFT µÄ¼ÓÈëÒ²Îª SFT ºÍ RL Ö®¼ä¹¹½¨ÁËÇÅÁº¡£

Mid-Training£ºÊ×ÏÈ£¬ÍÅ¶Ó½Ì»á´óÄ£ÐÍ¸÷ÖÖ»ù±¾¼¼ÄÜ£¬°üÀ¨ÈçºÎÊ¹ÓÃ¹¤¾ß¡¢ÈçºÎÀí½âÓÃ»§ÒâÍ¼µÈ£»SFT£ºÆä´Î£¬ÓÃ¸ßÖÊÁ¿µÄ¹ì¼£Êý¾Ý£¬ÈÃÄ£ÐÍÑ§Ï°ÈçºÎÖ´ÐÐÕæÊµµÄÏÂÓÎÈÎÎñ£»RFT£º×îºó£¬ÔÚÄ£ÐÍ×¼±¸ ¡°×ÔÓÉÌ½Ë÷¡± Ö®Ç°£¬ÏÈÓÉ½ÌÊ¦¹ì¼£ÊÖ°ÑÊÖ½Ì»áÄ£ÐÍÈçºÎÌ½Ë÷£¬±£ÕÏÁËÄ£ÐÍºóÐøÔÚ RL ½×¶ÎµÄÎÈ¶¨ÐÔ¡£

ËÄ¡¢´ó¹æÄ£ Agentic RL

1¡¢»ùÓÚìØµÄÊ÷¼ôÖ¦£¨Entropy Based Tree Pruning£©

Kwaipilot ÍÅ¶Ó·¢ÏÖ£¬¼´±ãÊ¹ÓÃÉÏÊö¼¼Êõ£¬¶ÔÍêÕûÊ÷ÖÐµÄËùÓÐ token ½øÐÐÑµÁ·µÄ³É±¾ÈÔÈ»¹ý¸ß£¬Òò´ËØ½ÐèÉè¼ÆÒ»ÖÖÄÜ¹»ÓÅÏÈ¾Û½¹ÓÚÐ¯´ø×îÇ¿ÑµÁ·ÐÅºÅ½ÚµãµÄ»úÖÆ¡£

Îª´Ë£¬ÍÅ¶Ó½«¹ì¼£Ñ¹Ëõ³ÉÒ»¸öÇ°×ºÊ÷£¬ÆäÖÐÃ¿¸ö½Úµã±íÊ¾Ò»¸ö¹²ÏíÇ°×º£¬Ã¿Ìõ±ß¶ÔÓ¦Ò»¶Î token¡£ÔÚ¹Ì¶¨µÄ¼ÆËãÔ¤ËãÏÂ£¬Ä¿±êÊÇÖ»±£Áô×îÓÐ¼ÛÖµµÄ½Úµã½øÐÐÑµÁ·¡£ÍÅ¶Ó»ùÓÚÊ÷ÖÐ¾ÛºÏµÄìØÐÅºÅºÍ½Úµã±»µ½´ïµÄ¿ÉÄÜÐÔÀ´¹À¼Æ½ÚµãµÄÐÅÏ¢Á¿£¬²¢°´ÕÕÖØÒªÐÔË³ÐòÀ©Õ¹½ÚµãÀ´¼ôÖ¦Ê÷£¬Ö±µ½Ô¤ËãºÄ¾¡¡£¶îÍâµÄÆô·¢Ê½·½·¨È·±£±£Áô½á¹¹ÉÏµÄÖØÒªÇøÓò£¨ÀýÈç£¬¹¤¾ß»òÄÚ´æÊÂ¼þ£©£¬²¢Î¬»¤¾Ö²¿ÉÏÏÂÎÄÒÔÎÈ¶¨ÑµÁ·¡£ÕâÖÖ»ùÓÚìØµÄ¼ôÖ¦´ó·ù¼õÉÙÈßÓà¼ÆËã£¬Í¬Ê±±£Áô´ó²¿·ÖÓÐÐ§µÄÑµÁ·ÐÅºÅ£¬´Ó¶øÊµÏÖÏÔÖøµÄÍÌÍÂÁ¿ÌáÉýºÍ¸üµÍµÄ×ÜÌå³É±¾¡£

2¡¢RL infra£º×ÔÑÐ SeamlessFlow ¿ò¼Ü

Í¼ 4£ºKwaipilot ÍÅ¶Ó×ÔÑÐµÄ RL ÑµÁ·¿ò¼Ü SeamlessFlow ¼Ü¹¹

ÎªÀ©Õ¹ RL£¬±ØÐë½« RL ÑµÁ·ÓëÖÇÄÜÌåµÄ¶àÑù»¯ÄÚ²¿Âß¼ÍêÈ«½âñî£¬Í¬Ê±×î´ó»¯Òì¹¹¼ÆËã¼Ü¹¹µÄÀûÓÃÂÊ¡£×ñÑ SeamlessFlow µÄÉè¼Æ£¬Kwaipilot ÍÅ¶ÓÔÚÖÇÄÜÌåºÍ RL ÑµÁ·Ö®¼äÉè¼ÆÁËÒ»¸ö×¨ÃÅÓÃÓÚ¹ì¼£Ê÷¹ÜÀíµÄÖÐ¼ä²ã£¬È·±£Á½ÕßÖ®¼äµÄÑÏ¸ñ·ÖÀë¡£´ËÍâ£¬²ÉÓÃÌá³öµÄ±êÇ©Çý¶¯µ÷¶È»úÖÆÀ´Ðµ÷Òì¹¹¼¯ÈºÖÐµÄÈÎÎñ·ÖÅä£¬´Ó¶ø×îÐ¡»¯¹ÜµÀÆøÅÝ²¢Î¬³Ö¸ßÍÌÍÂÁ¿ÑµÁ·¡£

3¡¢Í³Ò»»·¾³½Ó¿ÚºÍÆóÒµ¼¶ RL Êý¾Ý¹¹½¨

Kwaipilot ÍÅ¶Ó»¹Í¨¹ýÍ³Ò»²»Í¬ RL Ö´ÐÐ»·¾³µÄ²¿ÊðºÍÆÀ¹À½Ó¿Ú£¬Ê¹ÈÎºÎÐÂÌí¼ÓµÄ»·¾³¶¼ÄÜÒÔµÍ³É±¾ÎÞ·ì¼¯³É¡£ÕâÖÖÍ³Ò»Éè¼ÆÎª¿çÒì¹¹Êý¾ÝÔ´ºÍÈÎÎñÀàÐÍÀ©Õ¹ RL ÑµÁ·µì¶¨ÁË¼áÊµ»ù´¡¡£¾ßÌåµ½Èí¼þ¿ª·¢³¡¾°£¬ÍÅ¶Ó¾Û¼¯ÓÚÈý¸ö»ù±¾×é¼þ£ºÓëÏàÓ¦·ÖÖ§´úÂëÅä¶ÔµÄÎÊÌâÃèÊö¡¢¿ÉÖ´ÐÐ»·¾³ºÍ¿ÉÑéÖ¤µÄ²âÊÔÓÃÀý¡£

Kwaipilot ÍÅ¶Ó´Ó¿ªÔ´²Ö¿âÊÕ¼¯ÀÈ¡ÇëÇóºÍÏà¹ØÎÊÌâ£¬²¢¸ù¾ÝÕâÐ©²Ö¿âµÄÐÇ±ê¡¢PR »î¶¯ºÍÎÊÌâÄÚÈÝ¹ýÂËµÍÖÊÁ¿Êý¾Ý£¬ËæºóÏµÍ³µØÎªÃ¿¸öÊÕ¼¯µÄÊµÀý¹¹½¨¿ÉÖ´ÐÐ»·¾³¾µÏñ²¢Éú³Éµ¥Ôª²âÊÔÓÃÀý¡£³ýÁËÈí¼þ¹¤³ÌÊý¾Ý£¬ÍÅ¶Ó»¹ÄÉÈëÁËÆäËû¿ÉÑéÖ¤ÁìÓò£¬ÈçÊýÑ§ºÍÍÆÀíÈÎÎñ£¬½øÒ»²½·á¸»ÁË RL ÐÅºÅµÄ¶àÑùÐÔ¡£

¸üÖØÒªµÄÊÇ£¬³ýÁË¿ªÔ´Êý¾Ý£¬ÍÅ¶Ó»¹½øÒ»²½ÊÕ¼¯²¢ÀûÓÃÀ´×ÔÕæÊµÊÀ½ç¹¤ÒµÏµÍ³µÄÄäÃûÆóÒµ¼¶´úÂë¿â½øÐÐ RL ÑµÁ·¡£Óë½öÔÚ¹«¹²²Ö¿â£¨Èç GitHub ÉÏµÄ²Ö¿â£©ÉÏÑµÁ·²»Í¬£¬ÕâÐ©²Ö¿âÍ¨³£°üº¬½Ï¼òµ¥µÄÏîÄ¿£¬¶øÕâÐ©´ó¹æÄ£¡¢¸´ÔÓµÄ´úÂë¿â ¡ª¡ª ¿çÔ½¶àÖÖ±à³ÌÓïÑÔ²¢´ú±íÕæÊµµÄÒµÎñÂß¼ ¡ª¡ª ÈÃÄ£ÐÍ½Ó´¥µ½¸ü¾ßÌôÕ½ÐÔµÄ¿ª·¢³¡¾°£¬Îª RL Ìá¹©ÁË¸ß¼ÛÖµµÄ×Ê²ú¡£ÑµÁ·ÖÇÄÜÌå½â¾öÕâÐ©ÕæÊµÊÀ½çµÄ¹¤ÒµÎÊÌâ²»½öÔöÇ¿ÁËÑ§Ï°µÄÂ³°ôÐÔ£¬»¹½«ËùµÃÄ£ÐÍµÄ±à³ÌÄÜÁ¦½¨Á¢ÔÚÏÖÊµµÄÉú²ú¼¶»·¾³ÖÐ¡£

Í¼ 5£ºÔÚ SWE-Bench Verified ÉÏ£¬¸÷½×¶ÎÑµÁ·¶ÔÄ£ÐÍµÄÐÔÄÜÓ°Ïì

Ä£ÐÍÐ§¹ûÕ¹Ê¾

KAT-Coder Ä£ÐÍ¾ß±¸Ç¿´óµÄ´úÂëÉú³ÉÄÜÁ¦£¬¿É¶ÀÁ¢Íê³ÉÍêÕûµÄÏîÄ¿¿ª·¢£¬Í¨¹ýµ÷ÓÃ±à³Ì¹¤¾ß¿ÉÊµÏÖ´Ó½»»¥Ê½ÓÎÏ·µ½´úÂëÖØ¹¹µÈ¶àÑù»¯±à³ÌÈÎÎñ¡£ÓÃ»§½öÐèÃèÊöÐèÇó£¬Ä£ÐÍ¼´¿É½»¸¶ÍêÕûµÄ´úÂë½â¾ö·½°¸¡£

1¡¢ÐÇ¿ÕÐ§¹û

2¡¢Ë®¹ûÈÌÕß

3¡¢´úÂëÖØ¹¹

´ó¹æÄ£ Agentic RL ºóµÄÓ¿ÏÖÄÜÁ¦

¶Ô¾¹ý´ó¹æÄ£ Agentic RL ÑµÁ·ºóµÄÄ£ÐÍ½øÐÐ·ÖÎö£¬Kwaipilot ÍÅ¶Ó¹Û²âµ½ÁËÁ½¸öÏÔÖøµÄÓ¿ÏÖÏÖÏó£º

¶Ô»°ÂÖ´ÎÏÔÖø½µµÍ£ºÄ£ÐÍÇãÏòÓÚÓÃ¸üÉÙµÄ½»»¥ÂÖ´ÎÍê³ÉÈÎÎñ£¬Ïà½ÏÓÚ SFT Ä£ÐÍ£¬Æ½¾ù¶Ô»°ÂÖ´ÎÏÂ½µÁË 32%£»¶à¹¤¾ß²¢ÐÐµ÷ÓÃ£ºÄ£ÐÍÕ¹ÏÖ³öÍ¬Ê±µ÷ÓÃ¶à¸ö¹¤¾ßµÄÄÜÁ¦£¬¶ø·Ç´«Í³µÄ´®ÐÐµ÷ÓÃ¡£

ÍÅ¶ÓÍÆ²â£¬ÕâÔ´ÓÚ¹ì¼£Ê÷½á¹¹´øÀ´µÄÒþÊ½ÓÅ»¯Ñ¹Á¦£¬Ê¹Ä£ÐÍ×ÔÈ»ÐÎ³ÉÐ§ÂÊÆ«ºÃÓë²¢ÐÐµ÷ÓÃÄÜÁ¦¡£

Ð§ÂÊÆ«ºÃµÄÐÎ³É£ºÔÚ¹ì¼£Ê÷½á¹¹ÖÐ£¬½Ï¶ÌµÄÂ·¾¶£¨¸üÉÙµÄ¶Ô»°ÂÖ´Î£©»á±»新万博体育£ºµÄÑµÁ·Ñù±¾¹²Ïí¡£Õâ´´ÔìÁËÒ»¸öÒþÊ½µÄÓÅ»¯Ñ¹Á¦£ºÄ£ÐÍÇãÏòÓÚÑ§Ï°¸ü¸ßÐ§µÄ½â¾ö·½°¸£»²¢ÐÐ»¯µÄ×ÔÈ»Ñ¡Ôñ£ºÔÚÊ÷½á¹¹ÖÐ£¬¶à¹¤¾ß²¢ÐÐµ÷ÓÃ´´ÔìÁË新万博体育£ºµÄ·ÖÖ§¿ÉÄÜÐÔ£¬ÕâÐ©·ÖÖ§ÔÚÑµÁ·Ê±±»¶ÀÁ¢´¦Àí£¬Ê¹µÃÄ£ÐÍÄÜ¹»Í¬Ê±Ì½Ë÷¶à¸ö¹¤¾ß×éºÏ¡£Í¬Ê±ìØ¼ôÖ¦»úÖÆ£¨Long-term Entropy Pruning£©±£ÁôÁËÐÅÏ¢Á¿½Ï´óµÄ½Úµã£¬¶ø¶à¹¤¾ßµ÷ÓÃ½ÚµãÍùÍù¾ßÓÐ¸ü¸ßµÄìØÖµ£¬Ê¹Ä£ÐÍÖð½¥Ñ§»áÁË "Åú´¦Àí" Ë¼Î¬¡£

Î´À´Õ¹Íû

Kwaipilot ÍÅ¶Ó½«³ÖÐøÌ½Ë÷´úÂëÖÇÄÜµÄÇ°ÑØÁìÓò£¬¿ªÍØ´´ÐÂ¿ÉÄÜ£º

ÔöÇ¿¹¤¾ß¼¯³É£ºÓëÁ÷ÐÐµÄ IDE¡¢°æ±¾¿ØÖÆÏµÍ³ºÍ¿ª·¢¹¤×÷Á÷Éî¶È¼¯³É£¬´´½¨ÎÞ·ìµÄ±àÂëÌåÑé¡£¶àÓïÑÔÀ©Õ¹£ºÀ©Õ¹ KAT Ä£ÐÍÄÜÁ¦ÒÔ¸²¸ÇÐÂÐËµÄ±à³ÌÓïÑÔºÍ¿ò¼Ü£¬È·±£È«ÃæµÄÓïÑÔÖ§³Ö¡£Ð×÷±àÂë£ºÌ½Ë÷¶àÖÇÄÜÌåÏµÍ³£¬ÈÃ KAT Ä£ÐÍÄÜ¹»ÔÚ¸´ÔÓµÄÈí¼þÏîÄ¿ÉÏÐÍ¬¹¤×÷£¬ÊµÏÖÇ°ËùÎ´ÓÐµÄÐ×÷¡£¶àÄ£Ì¬´úÂëÖÇÄÜ£º¼¯³ÉÊÓ¾õÀí½âÄÜÁ¦£¬´¦Àí¼Ü¹¹Í¼¡¢UI Éè¼Æ¡¢µ÷ÊÔ½ØÍ¼ºÍÎÄµµÍ¼ÏñÒÔ¼°´úÂë£¬Ê¹¿ª·¢¹ý³Ì¸ü¼ÓÖ±¹ÛºÍ¸ßÐ§¡£

ÔÎÄÁ´½Ó£ºhttps://kwaipilot.github.io/KAT-Coder/

??Ê±ÊÂ1£º男男GayGAYs✅外卖员

??09ÔÂ20ÈÕ,联播一瞬丨送别“两弹一星”元勋周光召同志,

¡¡¡¡·¢Éú»ðÔÖ£¬Í¬Ñ§ÃÇÒ»¶¨Òª±£³ÖÕò¾²£¬Á¿Á¦¶øÐÐ¡£»ðÔÖ³õÆð½×¶Î£¬Ò»°ãÊÇºÜÐ¡µÄÒ»¸ö»ðµã£¬È¼ÉÕÃæ»ý²»´ó£¬²úÉúµÄÈÈÁ¿²»¶à¡£ÕâÊ±Ö»ÒªËæÊÖÓÃÉ³ÍÁ¡¢¸ÉÍÁ¡¢½þÊªµÄÊÖ½í¡¢ÃÞ¡¢Âé´üµÈÈ¥¸²¸Ç£¬¾ÍÄÜÊ¹³õÆðµÄ»ðÏ¨Ãð¡£

,貂蝉被下春药调教成浪货小说¡£

??09ÔÂ20ÈÕ,严查拒载、议价、绕路等行为北京开展出租汽车行业专项整治行动上海上半年签发口岸外国人团体旅游签证4.3万人次环比增长近两成,

¡¡¡¡¡°ÄãµÄÃû×Ö¡¡¡±Ð¡²»µãÄÓÍ·£¬ËûÃÇÓµÓÐÒ»ÑùµÄÃû×Ö¡£

,男生Gay撒尿j喷水视频,免费A漫-禁漫天堂,佐鸣本子18禁无遮挡▓¡£

??Ê±ÊÂ2£º申鹤被到爽高潮痉挛网站

??09ÔÂ20ÈÕ,菲律宾极端高温天气已致7人死亡,

¡¡¡¡Ò²Ðí£¬Ö»ÓÐ±Õ¹ØµÄ×å³¤ÓëÓÐÊýµÄÒ»Á½ÈË²»»á³Ô¾ª£¬ÒòÎªÊýÊ®ÄêÇ°£¬ËûÃÇÔÚÄÇ¸ö´óÓêäèãû¡¢µçÉÁÀ×ÃùµÄÓêÒ¹£¬¼ûµ½ÁË¸üÎª¿Ö²ÀµÄ³¡¾°¡£

,乖～把腿张开点h边做边说荤话,91漫画网站永久入口,老师⋯丝袜脚⋯快夹好紧¡£

??09ÔÂ20ÈÕ,广东高院发布“促进新质生产力发展”知识产权保护典型案例,

¡¡¡¡Ä¿±êÊÇÎÒÃÇÑ§Ï°µÄº½µÆ£¬Ã»ÓÐÁËÄ¿±êÎÒÃÇÃ»ÓÐÁËÑ§Ï°µÄÅ¬Á¦·½Ïò¡¢Ñ§Ï°µÄ¶¯Á¦¡£Òò´Ë£¬ÎÒÃÇÓ¦ÔÚ³õÒ»Äê¼¶¾ÍÈ·¶¨×Ô¼º³õÖÐÈýÄêµÄÑ§Ï°Ä¿±ê£¬ÔÙ°Ñ´óÄ¿±êÏ¸»¯³ÉÐ¡Ä¿±ê£¨°üÀ¨Ã¿Ñ§ÆÚµÄÆÚÖÐÄ¿±êºÍÆÚÄ©Ä¿±ê£¬Ñ§¿ÆÑ§Ï°Ä¿±ê£©£¬µ±È»¶þÈýÄê¼¶»¹ÓÐÃ»ÓÐÑ§Ï°Ä¿±êµÄÍ¬Ñ§ÃÇÏÖÔÚÈ·Á¢Ò²ÄÜÍöÑò²¹ÀÎ¡£ÓÈÆäÊÇ³õÈýÄê¼¶µÄÍ¬Ñ§ÃÇÖ»ÓÐÒ»ÄêµÄ³õÖÐÑ§Ï°ÁË£¬ÕâÊÇÄãÃÇÈËÉúµÄµÚÒ»¸öÖØÒª×ªÕÛµã£¬ÄãÃÇ¸üÓ¦¸ÃÓÐÃ÷È·µÄÑ§Ï°Ä¿±ê¡£Í¬Ñ§ÃÇ£¬Ä¿±êÓÐÁË£¬×îÖÕÄÜ·ñÊµÏÖ£¬¹Ø¼ü»¹ÊÇÎÒÃÇÓÐÃ»ÓÐÎªÄ¿±ê¶øÅ¬Á¦Ñ§Ï°¡¢·Ü·¢Í¼Ç¿¡£ÏÂÀ´Ö®ºóÇëÍ¬Ñ§ÃÇÖÆ¶¨ºÃ×Ô¼ºµÄÐ¡Ä¿±êºÍ´óÄ¿±ê£¬½»Ò»·Ýµ½°àÖ÷ÈÎ´¦Áô´æ£¬Ò²ÕÅÌùÔÚÎÒÃÇµÄÐ¡×éÕ¹Ê¾À¸ÉÏ£¬Ê±¿ÌÌáÐÑ×Ô¼º¡£

,啊哥哥的大吉霸在线观看,giantess18XXXXHDvideos,武警男同教练龙阳呻吟¡£

??Ê±ÊÂ3£º香蕉文化漫画❌黄漫网址

??09ÔÂ20ÈÕ,中央气象台：未来一周，全国大部地区大气扩散条件较好,

¡¡¡¡ÏÂÃæÊÇÃËÖ÷µÄÃûµ¥£º

,老师让我她喷出来了好爽的作文,脱👙让学生C🐻-文章,污污污18♥网站破解版¡£

??09ÔÂ20ÈÕ,“天下为公——一代伟人孙中山”原创展览在穗开幕,

¡¡¡¡ÕâÊÇÒ»Í·Ñªõõ£¬ÄÜÓÐÁ½Ã×¶à³¤£¬Í¨ÌåÈçºìÂêè§°ã¾§Ó¨£¬»¹ÉúÓÐÒ»¶Ô³àºìÈçÏ¼µÄ³á°ò£¬ËäÈ»Ìå»ýÎÞ·¨Óë¾ÞÊÞÏà±È£¬µ«ÊÇÈ´¸ñÍâÇ¿´ó¡£

,神里绫华被❌被挤乳羞羞,俄罗斯美女被猛烈进入,摸进她的小内裤里疯狂捏¡£

??Ê±ÊÂ4£º91|牛牛|国产人妻♥

??09ÔÂ20ÈÕ,数据资产化激活要素价值,

¡¡¡¡¡°ÕòÉ±£¡¡±

,静香被大雄调教到奶水直流,les🔞LV免费观看在线,香蕉文化漫画❌黄漫网站¡£

??09ÔÂ20ÈÕ,台媒：知名音乐人刘家昌病逝,

¡¡¡¡¡°àÅ£¬¶«Î÷²»´í¡£¡±ÄÇÎªÊ×µÄÄÐ×ÓµãÍ·£¬³Ö×Å±¦¹Ç¿´ÁËÓÖ¿´£¬µÀ£º¡°ßö£¬¸øÄãÊ®Ã¶¾«èµ£¬Õâ¿é·û¹ÇÎÒÃÇÂòÁË¡£¡±Ëµ°Õ£¬Ëû¶ªÏÂÒ»Ð©¾§Ó¨µÄ¿é×´Îï£¬×ªÉí¾Í×ß¡£

,免费看男男Gay啪啪动漫,西施自慰❌❌喷水好爽,skilllab071全集免费播放¡£

¡¾专访《你也有今天》导演陈铭章：观众对偶像剧的评看标准在发生变化¡¿

¡¾雄安新区雄县发布外贸服务资金池项目¡¿

Ôð±à£º贺南洪

ÉóºË£º梅肯

Ôð±à£º霍利尔

Ïà¹ØÍÆ¼ö »»Ò»»»