关于AIGC人工智能、思维方式、知识拓展,能力提升等。投稿/合作: @inside1024_bot
AIGC 领域的最新工具、开源项目以及行业大事件
AIGC 领域的最新工具、开源项目以及行业大事件
我昨天讲过,如果让一个coding agent解决一个非常复杂的任务,一般你直接敲进去,agent会一步步执行,或许成功,或许失败。
这时候你手动verify,如果发现没完成,你会让coding agent反复继续,再verify,再继续,直到这个任务完成。
我知道很多人也探索到了这件事,于是告诉它, “请继续尝试完成任务,修复所有的errors、exceptions、bugs、跑通所有的test case,一直这么做,直到彻底解决任务”
这相当于a big while loop:while(任务没完成) {你给我继续干活}
然而这个“任务没完成”的criteria如果依赖于这个agent本身,是非常危险的,因为他在每个loop中间都有概率直接停止掉,然后告诉你
“已经非常成功完美地解决了所有问,并且尚存一些已知的问,比如……”
这时候你一定血压上来了,不用手动verify,直接敲个“continue”。
这时候你想明白了,让你的coding agent当作master agent,让它创建一个subagent,当subagent完成后,master agent来完成verify并且决定是否continue,让“你必须完成任务”作为master agent停止整个big while loop的criteria。
你并不在乎烧多少token,你只在乎你的subagent是否努力实现了你的criteria,如果没有实现,就让它永远继续,或者添加更多的test case并且继续。
这时候subagent逃脱出这个big while loop的可能性就更小了,因为criteria不在他的判定范围内。
当然,许多年前人们早就证明了LLM Agent通过无休止烧token完全可以模拟一个turing-complete machine,我今天讲的所有一切,都基于这个证明。
我只是跟你们讲一些个人的practice。
TypeScript的首个C++编译器,第一个版本是用OnlySpecs生成的,功能框架搭好,但是对于异常复杂的parser和typescript各种类型语法,几乎全错,
用这种方法,claude code花了累计将近72小时才把后面的所有问修完。
最开始我也尝试一次次手动verify,两次之后我就发现不行了,让它自己verify,结果让一个agent自己掌握criteria来判断是否continue是个同样危险的决定,它依然在解决了某几个任务后停下来,欣喜若狂地告诉我,
“我们已经完美地完成了所有任务,另外我们还存在3个已知的问……”
于是有了我上面这一大段完整的论述。
幸运的是,对于一个TypeScript compiler in C++,这个criteria非常容易找到,只要跑2000个unit test就可以断定implementation的正确性,只要有任何差错,就要continue,
而对于另一些任务,我认为找到这个criteria恐怕是非常困难的,这个方法也许会完全不适用。
@aigc1024
OpenClaw小龙虾🦞专属频道
@openclaw1024
这时候你手动verify,如果发现没完成,你会让coding agent反复继续,再verify,再继续,直到这个任务完成。
我知道很多人也探索到了这件事,于是告诉它, “请继续尝试完成任务,修复所有的errors、exceptions、bugs、跑通所有的test case,一直这么做,直到彻底解决任务”
这相当于a big while loop:while(任务没完成) {你给我继续干活}
然而这个“任务没完成”的criteria如果依赖于这个agent本身,是非常危险的,因为他在每个loop中间都有概率直接停止掉,然后告诉你
“已经非常成功完美地解决了所有问,并且尚存一些已知的问,比如……”
这时候你一定血压上来了,不用手动verify,直接敲个“continue”。
这时候你想明白了,让你的coding agent当作master agent,让它创建一个subagent,当subagent完成后,master agent来完成verify并且决定是否continue,让“你必须完成任务”作为master agent停止整个big while loop的criteria。
你并不在乎烧多少token,你只在乎你的subagent是否努力实现了你的criteria,如果没有实现,就让它永远继续,或者添加更多的test case并且继续。
这时候subagent逃脱出这个big while loop的可能性就更小了,因为criteria不在他的判定范围内。
当然,许多年前人们早就证明了LLM Agent通过无休止烧token完全可以模拟一个turing-complete machine,我今天讲的所有一切,都基于这个证明。
我只是跟你们讲一些个人的practice。
TypeScript的首个C++编译器,第一个版本是用OnlySpecs生成的,功能框架搭好,但是对于异常复杂的parser和typescript各种类型语法,几乎全错,
用这种方法,claude code花了累计将近72小时才把后面的所有问修完。
最开始我也尝试一次次手动verify,两次之后我就发现不行了,让它自己verify,结果让一个agent自己掌握criteria来判断是否continue是个同样危险的决定,它依然在解决了某几个任务后停下来,欣喜若狂地告诉我,
“我们已经完美地完成了所有任务,另外我们还存在3个已知的问……”
于是有了我上面这一大段完整的论述。
幸运的是,对于一个TypeScript compiler in C++,这个criteria非常容易找到,只要跑2000个unit test就可以断定implementation的正确性,只要有任何差错,就要continue,
而对于另一些任务,我认为找到这个criteria恐怕是非常困难的,这个方法也许会完全不适用。
@aigc1024
OpenClaw小龙虾🦞专属频道
@openclaw1024
2025年12月份,大玩家 赌神附体,狂揽一个亿,可自行验证
永久网址
🏆全网广告费每月投入高达500万
🏆平台优势:
1️⃣ #电子真人0审核包出款、#反水无上限
2️⃣ #巨额无忧,每日提款不限额度不限次数
3️⃣
4️⃣ #不限ip、#免实名,无需绑手机号、信息安全有保障
🏆Y3 国际 全站封神榜
➡️ 8月13号 神秘玩家仅用300u爆奖140万u,成功提款1088888u
➡️ 8月16号 反水1700u仅用80u爆奖54万u,成功提款60万u
➡️ 10月10号 大哥在PG麻将胡了爆奖260万u,成功提款210万u
➡️ 12月6号 神秘盘总PA真人豪赢400万u,成功提款370万u
👑#反水无上限 日提无上限 日出千万
👑#每日存款彩金每日送,每笔存款加赠
🌐官网注册链接: y3867.com
💖 Y3国际专属客服:@Y3VIP8888
➡️ 双向用户点击: @Y3VIP777_bot
✅ 更多优惠活动关注福利频道: @Y3VIP678
😃 爆庄实录|3天狂揽1086万U😃 新客首存1000,豪提120万U😃 500一拉,PG实力兑现133万U💵 亿万储备金,大额无忧
🇭🇰 香港六合彩,特码 55 倍
永久网址
🏆#182体育 豪礼大放送、#高端嫩模、劳力士手表、奔驰E300等大礼等你来豪夺 首存日存彩金送不停
🏆182体育 封神榜🏆
➡️ 12月14号神秘盘总pp电子极速糖果直接炸150万成功提款142万
➡️ 12月26日实力大哥PA真人豪赢170万成功提款163万
➡️ 1月7号神秘大哥PG麻将胡了直接爆120万成功提款117万
🏆平台优势:
1️⃣ #平台公平、公正、公开,信誉第一、服务第一
2️⃣ #免实名 不限ip 无需绑定手机号码和银行卡
3️⃣ #u存u提 每日提款无上限 资金保障、大额无忧
4️⃣ #平台支持
🎖每日存款彩金每日送,每笔存款加赠
🎖182 体育 #电子 #真人 #0审核包出款 日出亿U
🌐 官网注册链接: 1820036.com
🍎专属VIP客服: @vipkf_182ty8
➡️ 双向用户点击: @vipkf_182ty2_bot
🍉 吃瓜搞笑:@chiguagaoxiaoxinwen
✅ 更多优惠活动关注福利频道: @vip182ty888
帮我通过以下命令安装 lark-cli npm install -g @larksuite/cli 然后通过以下命令安装相关 skills npx skills add https://github.com/larksuite/cli -y -g
安装完成后,请给我发送应用配置链接,引导我完成应用的配置。
用小龙虾的朋友们,飞书的小龙虾官方插件很快也会包含这些内容,可以不用下载CLI。
安装完成后,请给我发送应用配置链接,引导我完成应用的配置。
用小龙虾的朋友们,飞书的小龙虾官方插件很快也会包含这些内容,可以不用下载CLI。
永久网址
👑 #球速体育 #豪礼大放送、高端嫩模、劳力士手表、奔驰E300等大礼等你来豪夺、首存日存彩金送不停
👑 球速体育 大会员再创新高:
➡️ 泰国大老板百家乐存50万出512万 查看记录
➡️ 柬埔寨大盘总喜提42万u查看记录
➡️ 单笔提款530万全网独一档查看记录
🏆平台优势:
1️⃣ u存u提每日提款无上限,随便提、全球不限ip、免实名、无需绑定手机号码和银行卡
2️⃣ 平台
3️⃣ 每日存款彩金每日送,每笔存款加赠
🌐官网注册网址: qs1736.cc
✅福利频道:@qsty8999
⚽️体育赛事推单:@QSTY988
㊙️午夜剧场:@madoudp9
☎️vip客服专属热线,添加客服领取活动福利
🌐官网客服: @QSTY567
➡️双向用户点击:@qsty168168_bot