AI探索指南

关于AIGC人工智能、思维方式、知识拓展，能力提升等。投稿/合作： @inside1024_bot
AIGC 领域的最新工具、开源项目以及行业大事件

郑州天塌了
刚摘得“微短剧之都”的帽子还没捂热乎
就要被Seedance生成的AI短剧直接降维碾压了
【🔥最火AI视频模型 Seedance 2.0 学习资料包】链接：
https://pan.quark.cn/s/ae07200cec63

@aigc1024

OpenClaw小龙虾🦞专属频道
@openclaw1024

3:19

智谱太抽象了，发布了 GLM5.1 但是没有写任何更新内容
比较实际的是这次直接开放给 Lite 用户了
短缺的显卡找到了？

19 小时前

可口可乐 CEO Quincey 辞职，说 AI 转型需要全新的领导者
？？？

20 小时前

《现有的机器人都没大脑？》
人形机器人马拉松让公众看到了我们的机器人，目前还是遥控的，事实上，具身智能存在大量的误导宣传，很多我们看到的很颠覆的视频，都是拍了十多次，终于有一次成功，于是作为宣传。

我们把具身智能划分为三个等级，现在的具身智能处在1.5的状态。

第一个等级，遥控表演级的巨声智能，类似宇树之前展示的波士顿动力训练框架、能完成翻跟斗跳舞打太极等等，这些我们称之为行为能力。如果仅仅有行为能力，商业价值是很有限的，除了上台表演景区互动，没有太多意义。此时，具身智能机器人要靠人为遥控，来完成较为复杂的行为目标。

第二个等级，工种级别的具身智能，在行为节点上是行为目标，比如：收纳衣物、打扫卫生、去商场买东西，一个行为目标下，包含了一系列行为节点的组织，比如收拾屋子是一个行为目标，里面就包含了移动抓取、放置等多类行为的组织，一旦具身智能能完成整件工作，就能化身为工种，大规模商用就有可能了，包括了家内服务陪伴的机器人、工厂内的工人、街道上的环卫巡逻快递机器人等等。

第三个等级，物种级别的具身智能。物种和工种的区别是什么呢？从一个视角，人类的文明就是由无数人类个体的，一个个行为目标堆砌而成的，在这之上，有一个认知和情绪决策的大脑决定了要做什么，一切的行为目标都来自于更高的动机的分解。

前面我们说现在的具身智能处在1.5的状态，也就是在完成各种行为目标上，现在的具身智能还无法做到泛化，只有在理想环境下能完成任务。

为什么这么难呢？因为在真实环境有无限的可能，就以导航去一个地方为例子，下楼梯可能电梯坏了、可能被人误导下错楼层、打车时，司机开一半有事要求其下车等等。所以无法靠编程预设。

那么如何从1.5做到2呢？需要有一个认知的大脑。遇到困境时，停下来思考基于我的处境可行的行为空间，为达到当前的目标，我下一步做什么。如果具身智能具备这种人类的慢速思考能力，就能够在预设训练以及预设经验的反应模式无法覆盖时，通过思考组织行为寻找突破，把任务向前推进。

20 小时前

我刚看到一个很疯狂的实验。
有人让 Claude 搭建了一个 “上帝视角” 终端：里面有 56 个实时运行的 AI agents，用来模拟真实世界的市场参与者。
每个 agent 都有记忆、人格和行为模式，会形成群体、产生意见领袖，并且实时改变观点。
@aigc1024

OpenClaw小龙虾🦞专属频道
@openclaw1024

1 天前

清华最新的开源项目，OpenMAIC：AI多智能体互动课堂，给定任何主或文档，AI自动生成完整的互动课程
有趣的是，里面有AI老师和AI同学，类似真实的虚拟教室，不止有AI老师讲课，还有AI同学陪学
集成了OpenClaw，可以直接在飞书、Slack、Telegram里生成课堂
给定主一键生成课堂内容，包括幻灯片讲义、测验、HTML交互式模拟、项目制学习（PBL）
课堂中的AI老师和AI同学可以
语音讲解
在白板上画图、写公式
主动发起讨论或点名让学生发言
进行圆桌辩论
OpenMAIC相当于一个AI原生的教育基础设施，从慕课看视频时代升级到了和AI 一起上课的虚拟课堂时代
@aigc1024

OpenClaw小龙虾🦞专属频道
@openclaw1024

1 天前

23年为什么看好机器人公司A：老板干过大项目，对战略有自己的判断逻辑且make sense部分形成了投资人共识，有资本的先发优势，且23年具身还没完全热
23年为什么看好公司B：B是做合成数据的，合成数据在机器人的很多传统场景已经有需求了，比如自动驾驶仿真之类的，具身时代模型更大之后只会放大这个需求，且当时已经有一些预订单；老板经验丰富，有业界资源

1 天前

企业ai化变革，首先是政治问题，然后是业务问题，最后才是技术问题

政治问题也是利益分配的问题，旧的利益格局被打破，很多人从有用的状态直接被斩杀到无用的状态，为了保住自己的饭碗、自己的利益，得反对改革。

业务问题是原有的工作模式是否有流程化，还有数字化的基建。流程和数据都没有，是没法实现AI化的。毕竟AI本质也只是提高了效率，原有的商业模式如果出了问题，效率再高也是徒劳。

@aigc1024

OpenClaw小龙虾🦞专属频道
@openclaw1024

1 天前

1. 📢 你不知道的内幕消息
一些你不知道的内幕消息，最新资讯、大公司负面、时政财经、网友发布等高质量消息。

2. 📢 互联网从业者充电站
互联网从业者专属
内容多为技术、产品、设计、运营等不同话题内容；

3. 📢 出海🚢&自媒体运营秘籍
分享出海经验、赚美金、运营技巧、小红书运营、网赚项目等。

4. 📢 中年人生存报告
关于职场、生活、创业、30+、失业等一些记录

5. 📢 金融·投资·Web3加密货币·美股
Web3加密市场、美股、金融投资，理财，金融知识；

6. 📢 你不知道的冷知识
有趣的、无趣的、有用的、没用的知识

7. 📢 优质信息收藏夹
优质软件/插件/网站等分享。好玩的、好用的数字产品分享。

8. 📢 每日吃瓜
每日吃瓜消息爆料。

9. 📢 副业赚钱探索指南
分享实用的赚钱策略，发现那些隐藏的赚钱宝藏。

10. 📢 草台班子世界
社会观察、奇闻视频、突发事件和生活短片。

你不知道的内幕消息🅥

1 天前

AI时代日新月异，您的孩子们未来学什么？华尔街日报最新调查：硅谷AI大佬们的小孩，在学什么？
@aigc1024

OpenClaw小龙虾🦞专属频道
@openclaw1024

1 天前

即梦+豆包AI指令，上万组提示词终极合集
🔗：https://pan.quark.cn/s/9f92e7f44155
@aigc1024

OpenClaw小龙虾🦞专属频道
@openclaw1024

1 天前

做了一个月投放之后我发现一个很反直觉的事情：投放的瓶颈根本不在投放，在素材。素材的瓶颈也不在创意本身，在生产效率。

你脑子里有再多想法，一周只能产出五条成品素材，就永远跑不过平台的疲劳周期。算法需要持续被喂新内容，而传统的制作流程：从脚本到拍摄到剪辑到上传，天然就是慢的。

这个结论是交了学费之后才想明白的。

一个月前我连Meta Ads Manager都没打开过。做了十年产品/工程/自然营销，从来没花过一分钱买流量。CPR这个词我第一反应是心肺复苏，attribution window怎么设不知道。然后因为团队调整，增长投放这件事突然落到了我手上。六位数的月预算，跑了两年的campaign架构，一整
套我完全看不懂的广告后台，需要有人马上接手，没有过渡期。

创业公司就是这样，事情来了你就得上。

接手之后做的第一件事不是学怎么建campaign（meta ads manager真的巨巨巨难用），是把过去两年的数据全翻了一遍。翻完发现一个很刺眼的事实：历史上花在网红渠道的钱，算到最终付费用户，单个成本是四位数美金。而同一时期，一个外包UGC创作者一条视频一百多美金，跑出来的注册成本比整个网红项目加起来还低，观众留存率是所有素材里最高的💀💀💀。

这个对比太明显了，它直接决定了接下来一个月的方向：❌传统渠道上补人，✅AI把UGC素材的生产效率升量级。

首先决定的是：素材全是AI生成的。我们同时起了五个campaign，每个campaign塞不同风格的角色和场景，想的是快速铺开看哪个方向有信号。头几天确实有几条素材跑出了还不错的数据，会觉得好像方向对了，开始有一点兴奋。然后两周之内全部崩了。五个campaign，每一个都在同一个时间段进入了素材疲劳。花费断崖式下降，转化几乎归零。最差的那一周，所有campaign加起来跑了整整七天，回来的注册个位数。看后台的时候真的会开始怀疑，AI生成的素材到底能不能转化？

后来复盘的时候才发现，公司内部文档里团队其实早就写过一份文档，把我们踩的每一个坑都预判到了。单一内容形式会快速消耗受众注意力，重复同一种风格只会加速疲劳，top-of-funnel的观众根本不想看产品demo。我们犯的不是AI的错误，是内容策略的错误，只不过用AI角色把传统的坑重新踩了一遍。

1 天前

AI探索指南

Photo

想明白这件事之后，第二代素材完全换了做法。不再只有一种格式，而是同时测POV视角、reaction，hook、多素材混剪。角色也不再单一，测试纪律拉起来👉每条素材给一小笔预算，48小时看数据，达标就放大，不达标就杀掉，不跟任何一条素材谈感情。这个框架跑起来之后，数据慢慢回来了。某些hook风格的点击率接近20%，特定角色加场景的组合在持续找到自己的受众。从噪音里开始能听到信号了。

这就是开头说的那个判断开始变清晰的时刻。

GEN2证明了AI素材是能转化的，但同时也证明了一件事：素材的生命周期比我想象的短得多。一条好素材可能只有几天的黄金期，之后就进入衰减。你不是在做"几条好内容"，你是在跟一个永远在消耗的系统赛跑。能赢的唯一方式就是让生产速度远远超过消耗速度。

所以接下来三周，我把几乎所有精力砸在了工具上。我们用Claude Code从零搭了一整套AI素材生产系统: 完整的、任何团队成员都可以直接调用的技能包体系。

举个具体🌰：假设我们在TikTok上看到一条爆款视频，觉得这个hook有意思想复用。在以前，这是一个需要看几遍、截图、写文档、开会讨论、再让剪辑师理解你意思的过程。现在的流程是：把链接丢进Claude Code的视频理解技能，它自动下载、拉字幕、做镜头分析、跟画面内容交叉比对，输出一份结构化的拆解报告，这条视频的开头三
秒用了什么情绪触发、文字出现在第几帧、转折点在哪里、哪些元素是可以迁移到我们产品的。拿着这份拆解，喂给prompt生成技能。这个技能通过一个变量矩阵——角色乘以场景乘以hook类型乘以CTA结尾——一次性输出二十条视频prompt变体。每一条都不一样，但都是基于同一个经过验证的结构生成的。

🌟创意思考被前置到了系统设计层面，到了生成环节就是纯粹的执行。

生成完的视频丢给组装技能，自动把hook片段、正片内容、CTA结尾拼在一起，叠上logo、字幕、标签，位置和尺寸根据视频分辨率自动算好。出来就是可以直接传到广告后台的成品。

角色一致性的问题也解决了。AI视频最头疼的就是character drift——你的角色换个镜头就长得不一样，观众一眼就能看出来是AI。我们在Kling和Seedance上搭了一套角色身份库，每个角色是
一个JSON文件，锁定五官比例、肤色、体型、发型、标志性配饰，生成的时候挂载上去，几十条视频里同一个人保持一致。

投放数据那头也接上了。Meta广告数据自动拉回来，按创意变量拆分：哪个角色在转化、哪个场景成本最低、哪种hook类型点击率最高。制作团队不需要猜下一批做什么，看这张表就知道算法在告诉你什么东西在起效。

整条链路走通之后，一个下午可以完成从"这条TikTok火了"到"这里有二十条基于它为什么火而生成的广告变体"的全流程。这在一个月前是不可能的事情。

但工具只是一半。另一半是用这套工具的人。这可能是这一个月里我最想说的部分。

我们招了四个人进ABG Army。三个年轻人，一个资深视频剪辑师。四个人没有一个碰过Claude Code，没有一个写过任何AI工作流。有一个进来的时候连终端都没打开过，不知道命令行是什么。

我没有给他们上课。没有做培训PPT，没有搞什么"AI入门三天速成"。方式很简单也很残酷，直接给真实任务、真实deadline，遇到不会的现场查现场解。每天一起搭，每天一起踩坑，每天收工的时候比早上多会一点东西。

现在团队有了固定的周度投放复盘节奏，campaign数据和创意策略在同一张桌子上看。有agency partner接进来跑同一套数据流。有一条能从爆款拆解一路走到批量生成的素材管线。有一个虽然只有几个人但每个人都能独立搭工具的团队。

这些东西三十天前全部不存在。

当然我们还差得很远。素材疲劳的周期还是比我想要的快。注册之后的漏斗追踪有缺口，意味着我们对用户从注册到付费这段路径的理解还是模糊的。我不知道的东西，大概比我现在意识到的要多得多。

但机器在转了。数据在流，素材在出，团队在长。每周回头看上一周，都会觉得上周的自己挺蠢的。这大概就是对的方向。

虽然才30天，但我们才刚刚开始💜

（100%原创，如有任何行为的转发，必须经过本人同意）

1 天前

Seedance2.0在个人vlog上表现还是很出色的，特别是运镜、转场、
氛围感、细节上面，做这种要求不高的娱乐视频还是轻轻松松的。
但是还是会有一些小问，比如配音不对（我把原片放出来了，第二个视频，这里面旁白是从哪冒出来的😂）字幕和清晰度的问也经常被诟病。
如果是商业视频，客户要求可能是100分，各种细节要各种抽卡才能解决，这个在目前还是比较难突破，特别是算力太紧了
这个提示词我放到这里了，需要的自取👇
@aigc1024

OpenClaw小龙虾🦞专属频道
@openclaw1024

1 天前

最近国家数据局给出的统计数据是，3月中国日均Token调用了超过140万亿。

昨天晚点LatePost又发了报道，字节豆包大模型的日均Token调用量在3月超过了100万亿。

我们假设两个数据都是成立的，那么岂不是豆包一家就占到了中国大模型整体消耗量的70%以上？

当然豆包大模型也可以有海外的调用量，但从市场表现来看，不会太多。

再就是口径问题，豆包的100万亿日均调用量，出自火山引擎，这个相对来说是比较清晰的。

国家数据局和其他政府机构一样，基本只给结论，不谈样本，用常识判断的话，它的信息是各家大模型公司上报过去的，没有自己的统计渠道。

所以就造成了解读上的不够精确：

全中国140万亿的日均调用量，是基于什么汇报口径？

同样是Tokens消耗，模型App是一个数，模型底座是一个数，云又是另一个数，而且云还得看是不是MaaS⋯⋯

不说清楚的话，理解偏差就会很大。

当然豆包模型的消耗占比偏大的原因也有合理性，就是全模态，同样是用ChatBot，你搁那问五分钟的交互消耗，和跟豆包打语音开视频相比，区别不是一般的大。

这也是豆包比较「占便宜」的地方，按照AI时代的北极星指标要从月活/日活变成用量这个暴论的说法，豆包和其他国产大模型的差距，比月活/日活的差距是要更大的。

火山引擎还提了一个点，就是Seedance模型在被广泛用在AI漫剧产业，AI漫剧的制作商在投入上相对充裕，从即梦等2C产品用户使用Seedance排队越来越痛苦也能察觉到，字节是在优先保障企业级付费用户的使用，叠加起来就是「极大带动了Token的消耗增长」。

但Seedance应该不会算在豆包大模型的调用量里，这个可以排除。

总之豆包这闷声上大分的成绩，是有点细思恐极的，不怕兄弟苦，就怕兄弟开路虎啊。

1 天前

让 AI 好好干活儿，把事情做好，一句扔给它显然是不够的。一句来，一句去，会让 AI 陷入到细节。陪伴式地结对编程，对人的消耗也特别大。
最高效的方式是，将任务分成两个阶段，第一阶段打磨框架，第二阶段做精细化调优。
前者需要人类想清楚事情的目标，以及产品服务的供给方式，给 AI 做好任务规划，让它可以大把大把吃 token；后者需要对 AI 执行结果做编排和重构，更多是为了对齐人类目标和 AI 理解之间的偏差。
因此，对 AI 的管理，需要两块能力，一是需求管理能力，包含了对需求的分门别类、需求的拆解和细化、需求的优先级打标管理等，这是传统 PM/TL/PD 常干的事儿；二是让 AI 并行工作的能力，这会涉及到 AI 之间的合作与协同，AI 之间需要分派指令、执行任务、回馈结果，也需要经常性地解决冲突。
当每个人都配备多个 AI Agent
的时候，如何管理 AI 会是一门新的学问，德鲁克老爷子提出的很多思想，在 AI 时代又需要进化啦😄
@aigc1024

OpenClaw小龙虾🦞专属频道
@openclaw1024

Before

After