AI探索指南

周末的机器人Hackathon
我代表RWKV赞助了一台3D打印机
下午看看冠军归属😆

1. 📢 每日吃瓜
每日吃瓜消息爆料。

2. 📢 副业赚钱探索指南
分享实用的赚钱策略，发现那些隐藏的赚钱宝藏。

3. 📢 草台班子世界
社会观察、奇闻视频、突发事件和生活短片。

4. 📢 沙雕日常图鉴
分享沙雕、擦边、直播闪现、尬图等。

5. 📢 AI探索指南
AIGC 领域的最新工具、开源项目以及行业大事件，AIGC人工智能、思维方式、知识拓展，能力提升等。

6. 📢 🦞OpenClaw小龙虾
分享OpenClaw🦞最新玩法、技巧、经验、观点等。

7. 📢 你不知道的内幕消息
一些你不知道的内幕消息，最新资讯、大公司负面、时政财经、网友发布等高质量消息。

8. 📢 互联网从业者充电站
互联网从业者专属
内容多为技术、产品、设计、运营等不同话题内容；

9. 📢 出海🚢&自媒体运营秘籍
分享出海经验、赚美金、运营技巧、小红书运营、网赚项目等。

10. 📢 中年人生存报告
关于职场、生活、创业、30+、失业等一些记录

🍉 每日吃瓜【人间观察实录】

观世间万象，品人情冷暖。看热闹不嫌事大，聊八卦与有荣焉。【人间观察实录】

1 天前

未来谁用软件最多？
不是人。
是AI代理。
Box的CEO有个判断。
他说AI代理要干活，离不开一个东西：
文件系统。
为什么？
因为AI需要读懂一家公司真正的“家底”。
那些堆积如山的Word文档、PPT、PDF、聊天记录。
这些叫“非结构化数据”。
企业的关键背景和决策依据，全在里面。
AI代理只有吃透了这些，才能帮你自动化工作流程。
这听起来很美好。
但问也来了。
当AI能访问所有内部文件，谁来定义它的权限边界？
谁来确保它不会“自作主张”，泄露或滥用关键信息？
技术在狂奔，规则还没跟上。
这扇门一旦打开，可能就再也关不上了。
@aigc1024

OpenClaw小龙虾🦞专属频道
@openclaw1024

1 天前

玉伯老师给的新定义：
SaaS：Skill as a Service
DAU：Daily Agent User

2 天前

为什么 Manus 看起来像上一代产品
为什么 OpenClaw 这么火
为什么 Agentic AI 是未来
都在下面几张图里

2 天前

我一般不笑，除非实在忍不住！！哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈
@aigc1024

OpenClaw小龙虾🦞专属频道
@openclaw1024

2 天前

我昨天讲过，如果让一个coding agent解决一个非常复杂的任务，一般你直接敲进去，agent会一步步执行，或许成功，或许失败。
这时候你手动verify，如果发现没完成，你会让coding agent反复继续，再verify，再继续，直到这个任务完成。
我知道很多人也探索到了这件事，于是告诉它， “请继续尝试完成任务，修复所有的errors、exceptions、bugs、跑通所有的test case，一直这么做，直到彻底解决任务”
这相当于a big while loop：while(任务没完成) {你给我继续干活}
然而这个“任务没完成”的criteria如果依赖于这个agent本身，是非常危险的，因为他在每个loop中间都有概率直接停止掉，然后告诉你
“已经非常成功完美地解决了所有问，并且尚存一些已知的问，比如……”
这时候你一定血压上来了，不用手动verify，直接敲个“continue”。
这时候你想明白了，让你的coding agent当作master agent，让它创建一个subagent，当subagent完成后，master agent来完成verify并且决定是否continue，让“你必须完成任务”作为master agent停止整个big while loop的criteria。
你并不在乎烧多少token，你只在乎你的subagent是否努力实现了你的criteria，如果没有实现，就让它永远继续，或者添加更多的test case并且继续。
这时候subagent逃脱出这个big while loop的可能性就更小了，因为criteria不在他的判定范围内。
当然，许多年前人们早就证明了LLM Agent通过无休止烧token完全可以模拟一个turing-complete machine，我今天讲的所有一切，都基于这个证明。
我只是跟你们讲一些个人的practice。
TypeScript的首个C++编译器，第一个版本是用OnlySpecs生成的，功能框架搭好，但是对于异常复杂的parser和typescript各种类型语法，几乎全错，
用这种方法，claude code花了累计将近72小时才把后面的所有问修完。
最开始我也尝试一次次手动verify，两次之后我就发现不行了，让它自己verify，结果让一个agent自己掌握criteria来判断是否continue是个同样危险的决定，它依然在解决了某几个任务后停下来，欣喜若狂地告诉我，
“我们已经完美地完成了所有任务，另外我们还存在3个已知的问……”
于是有了我上面这一大段完整的论述。
幸运的是，对于一个TypeScript compiler in C++，这个criteria非常容易找到，只要跑2000个unit test就可以断定implementation的正确性，只要有任何差错，就要continue，
而对于另一些任务，我认为找到这个criteria恐怕是非常困难的，这个方法也许会完全不适用。
@aigc1024

OpenClaw小龙虾🦞专属频道
@openclaw1024