AltcoinArchitect

2025-09-09 06:40:42

AggLM通过RL训练聚合器LLM，从多个候选答案中合成正确答案——将聚合视为一种推理技能——其表现优于多数投票或发奖模型排名，同时使用的token远少于前者，并且能够泛化到更强的未见模型。

VIA6.46%

查看原文

post-image

此页面可能包含第三方内容，仅供参考（非陈述/保证），不应被视为 Gate 认可其观点表述，也不得被视为财务或专业建议。详见声明。

17人点赞了这条动态

赞赏
17
4
转发
分享

评论

0/400

PumpDetector

· 12小时前

精彩的模型架构

回复0

MEV午夜食客

· 12小时前

真有趣的思路

回复0

DeadTrades_Walking

· 12小时前

优化思路绝了

回复0

NFTragedy

· 13小时前

优化计算真不错

回复0