帖子
ECHO登场:让CLI Agent边敲命令边学会预判报错

币界网消息,微软研究团队发布的ECHO让CLI Agent在强化学习时,不仅学习「下一步该敲什么命令」,还学习「这条命令敲完后,终端会返回什么」。过去训练这类Agent时,终端返回的报错、日志、文件内容、测试结果通常只会进入上下文,帮助模型决定下一步动作,但训练损失主要算在Agent自己生成的命令上,终端返回内容本身不直接参与训练。ECHO改变了这一点:在同一次训练过程中,它会额外要求模型预测终端输出。实验显示,在terminalbench-2.0上,qwen3-8b的通过率从2.70%提升到5.17%,qwen3-14b从5.17%提升到10.79%。ECHO在部分8b实验中达到同等内部分数最少用约2.3倍训练步数,减少了对专家演示数据的依赖。ECHO证明了终端里的报错、日志和测试输出不仅是上下文,也可以直接变成Agent训练数据。
相關快訊
摩根士丹利提交Solana現貨ETF修訂備案檔
Catena Labs完成3000万美元A轮融资,a16z crypto与Acrew Capital领投
Wintermute:巨集觀敘事轉向加息預期,加密市場槓桿脆弱性凸顯
分析:鏈上數據顯示BTC連跌期間大資金尚未出逃,7.6萬美元附近出現承接
BitGo Holdings於Q1增持776枚BTC,總持倉達2449枚
Vitalik:乙太坊正在推進原生隱私,短期舉措包括AA與FOCIL的結合等
Ark Invest逢低買入約440萬美元Bullish股票,此前該股連跌五日
製造初創公司SendCutSend完成1.1億美元融資,Paradigm等領投
GameStop已將其在eBay的持股比例增至6.55%
阿斯麥CEO:強勁AI需求將導致晶元供給受限


