关于AIGC人工智能、思维方式、知识拓展,能力提升等。投稿/合作: @inside1024_bot
AIGC 领域的最新工具、开源项目以及行业大事件
周末的机器人Hackathon
我代表RWKV赞助了一台3D打印机
下午看看冠军归属😆
1. 📢 每日吃瓜
每日吃瓜消息爆料。

2. 📢 副业赚钱探索指南
分享实用的赚钱策略,发现那些隐藏的赚钱宝藏。

3. 📢 草台班子世界
社会观察、奇闻视频、突发事件和生活短片。

4. 📢 沙雕日常图鉴
分享沙雕、擦边、直播闪现、尬图等。

5. 📢 AI探索指南
AIGC 领域的最新工具、开源项目以及行业大事件,AIGC人工智能、思维方式、知识拓展,能力提升等。

6. 📢 🦞OpenClaw小龙虾
分享OpenClaw🦞最新玩法、技巧、经验、观点等。

7. 📢 你不知道的内幕消息
一些你不知道的内幕消息,最新资讯、大公司负面、时政财经、网友发布等高质量消息。

8. 📢 互联网从业者充电站
互联网从业者专属
内容多为技术、产品、设计、运营等不同话题内容;

9. 📢 出海🚢&自媒体运营秘籍
分享出海经验、赚美金、运营技巧、小红书运营、网赚项目等。

10. 📢 中年人生存报告
关于职场、生活、创业、30+、失业等一些记录
未来谁用软件最多?
不是人。
是AI代理。
Box的CEO有个判断。
他说AI代理要干活,离不开一个东西:
文件系统。
为什么?
因为AI需要读懂一家公司真正的“家底”。
那些堆积如山的Word文档、PPT、PDF、聊天记录。
这些叫“非结构化数据”。
企业的关键背景和决策依据,全在里面。
AI代理只有吃透了这些,才能帮你自动化工作流程。
这听起来很美好。
但问也来了。
当AI能访问所有内部文件,谁来定义它的权限边界?
谁来确保它不会“自作主张”,泄露或滥用关键信息?
技术在狂奔,规则还没跟上。
这扇门一旦打开,可能就再也关不上了。
@aigc1024

OpenClaw小龙虾🦞专属频道
@openclaw1024
玉伯老师给的新定义:
SaaS:Skill as a Service
DAU:Daily Agent User
为什么 Manus 看起来像上一代产品
为什么 OpenClaw 这么火
为什么 Agentic AI 是未来
都在下面几张图里
我一般不笑,除非实在忍不住!!哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈
@aigc1024

OpenClaw小龙虾🦞专属频道
@openclaw1024
我昨天讲过,如果让一个coding agent解决一个非常复杂的任务,一般你直接敲进去,agent会一步步执行,或许成功,或许失败。
这时候你手动verify,如果发现没完成,你会让coding agent反复继续,再verify,再继续,直到这个任务完成。
我知道很多人也探索到了这件事,于是告诉它, “请继续尝试完成任务,修复所有的errors、exceptions、bugs、跑通所有的test case,一直这么做,直到彻底解决任务”
这相当于a big while loop:while(任务没完成) {你给我继续干活}
然而这个“任务没完成”的criteria如果依赖于这个agent本身,是非常危险的,因为他在每个loop中间都有概率直接停止掉,然后告诉你
“已经非常成功完美地解决了所有问,并且尚存一些已知的问,比如……”
这时候你一定血压上来了,不用手动verify,直接敲个“continue”。
这时候你想明白了,让你的coding agent当作master agent,让它创建一个subagent,当subagent完成后,master agent来完成verify并且决定是否continue,让“你必须完成任务”作为master agent停止整个big while loop的criteria。
你并不在乎烧多少token,你只在乎你的subagent是否努力实现了你的criteria,如果没有实现,就让它永远继续,或者添加更多的test case并且继续。
这时候subagent逃脱出这个big while loop的可能性就更小了,因为criteria不在他的判定范围内。
当然,许多年前人们早就证明了LLM Agent通过无休止烧token完全可以模拟一个turing-complete machine,我今天讲的所有一切,都基于这个证明。
我只是跟你们讲一些个人的practice。
TypeScript的首个C++编译器,第一个版本是用OnlySpecs生成的,功能框架搭好,但是对于异常复杂的parser和typescript各种类型语法,几乎全错,
用这种方法,claude code花了累计将近72小时才把后面的所有问修完。
最开始我也尝试一次次手动verify,两次之后我就发现不行了,让它自己verify,结果让一个agent自己掌握criteria来判断是否continue是个同样危险的决定,它依然在解决了某几个任务后停下来,欣喜若狂地告诉我,
“我们已经完美地完成了所有任务,另外我们还存在3个已知的问……”
于是有了我上面这一大段完整的论述。
幸运的是,对于一个TypeScript compiler in C++,这个criteria非常容易找到,只要跑2000个unit test就可以断定implementation的正确性,只要有任何差错,就要continue,
而对于另一些任务,我认为找到这个criteria恐怕是非常困难的,这个方法也许会完全不适用。
@aigc1024

OpenClaw小龙虾🦞专属频道
@openclaw1024
Back to Top