帖子
ECHO登场:让CLI Agent边敲命令边学会预判报错

币界网消息,微软研究团队发布的ECHO让CLI Agent在强化学习时,不仅学习「下一步该敲什么命令」,还学习「这条命令敲完后,终端会返回什么」。过去训练这类Agent时,终端返回的报错、日志、文件内容、测试结果通常只会进入上下文,帮助模型决定下一步动作,但训练损失主要算在Agent自己生成的命令上,终端返回内容本身不直接参与训练。ECHO改变了这一点:在同一次训练过程中,它会额外要求模型预测终端输出。实验显示,在terminalbench-2.0上,qwen3-8b的通过率从2.70%提升到5.17%,qwen3-14b从5.17%提升到10.79%。ECHO在部分8b实验中达到同等内部分数最少用约2.3倍训练步数,减少了对专家演示数据的依赖。ECHO证明了终端里的报错、日志和测试输出不仅是上下文,也可以直接变成Agent训练数据。
相关快讯
Garrett Jin地址3倍做空超5.7万枚ZEC,其5倍BTC多单现浮亏92万美元
Michael Saylor:Strategy不排除2026年出售部分比特币
a16z:代币化商品市场几乎完全由黄金主导,规模已达50亿美元
伊朗关闭西部空域
a16z:代币化大宗商品市场黄金占比约50亿美元
灰度研究:监管透明度提升将推动区块链应用爆发
稳定币发行商JPYC即将完成B轮融资,Life Design Fund等参投,累计融资额约3140万美元
美国IC3:2025年加密ATM投诉超13400起,损失超3.88亿美元
美国银行Q1加密ETF投资敞口近5300万美元
吴说:AAVE、MetaMask与万事达卡达成合作

