帖子
ECHO登场:让CLI Agent边敲命令边学会预判报错

币界网消息,微软研究团队发布的ECHO让CLI Agent在强化学习时,不仅学习「下一步该敲什么命令」,还学习「这条命令敲完后,终端会返回什么」。过去训练这类Agent时,终端返回的报错、日志、文件内容、测试结果通常只会进入上下文,帮助模型决定下一步动作,但训练损失主要算在Agent自己生成的命令上,终端返回内容本身不直接参与训练。ECHO改变了这一点:在同一次训练过程中,它会额外要求模型预测终端输出。实验显示,在terminalbench-2.0上,qwen3-8b的通过率从2.70%提升到5.17%,qwen3-14b从5.17%提升到10.79%。ECHO在部分8b实验中达到同等内部分数最少用约2.3倍训练步数,减少了对专家演示数据的依赖。ECHO证明了终端里的报错、日志和测试输出不仅是上下文,也可以直接变成Agent训练数据。
相关快讯
Perp DEX Variational完成5000万美元A轮融资,Dragonfly Capital领投
摩根士丹利提交Solana现货ETF修订备案文件
Catena Labs完成3000万美元A轮融资,a16z crypto与Acrew Capital领投
Wintermute:宏观叙事转向加息预期,加密市场杠杆脆弱性凸显
分析:链上数据显示BTC连跌期间大资金尚未出逃,7.6万美元附近出现承接
BitGo Holdings于Q1增持776枚BTC,总持仓达2449枚
Vitalik:以太坊正在推进原生隐私,短期举措包括 AA 与 FOCIL 的结合等
Ark Invest逢低买入约440万美元Bullish股票,此前该股连跌五日
制造初创公司SendCutSend完成1.1亿美元融资,Paradigm等领投
特朗普:很多人提醒注意中期选举,但我一点也不着急

