关于AIGC人工智能、思维方式、知识拓展,能力提升等。投稿/合作: @inside1024_bot
AIGC 领域的最新工具、开源项目以及行业大事件
郑州天塌了
刚摘得“微短剧之都”的帽子还没捂热乎
就要被Seedance生成的AI短剧直接降维碾压了
🔥最火AI视频模型 Seedance 2.0 学习资料包】 链接:
https://pan.quark.cn/s/ae07200cec63

@aigc1024

OpenClaw小龙虾🦞专属频道
@openclaw1024
Media is too big
VIEW IN TELEGRAM
智谱太抽象了,发布了 GLM5.1 但是没有写任何更新内容
比较实际的是这次直接开放给 Lite 用户了
短缺的显卡找到了?
可口可乐 CEO Quincey 辞职,说 AI 转型需要全新的领导者
???
《现有的机器人都没大脑?》
人形机器人马拉松让公众看到了我们的机器人,目前还是遥控的,事实上,具身智能存在大量的误导宣传,很多我们看到的很颠覆的视频,都是拍了十多次,终于有一次成功,于是作为宣传。

我们把具身智能划分为三个等级,现在的具身智能处在1.5的状态。

第一个等级,遥控表演级的巨声智能,类似宇树之前展示的波士顿动力训练框架、能完成翻跟斗跳舞打太极等等,这些我们称之为行为能力。如果仅仅有行为能力,商业价值是很有限的,除了上台表演景区互动,没有太多意义。此时,具身智能机器人要靠人为遥控,来完成较为复杂的行为目标。

第二个等级,工种级别的具身智能,在行为节点上是行为目标,比如:收纳衣物、打扫卫生、去商场买东西,一个行为目标下,包含了一系列行为节点的组织,比如收拾屋子是一个行为目标,里面就包含了移动抓取、放置等多类行为的组织,一旦具身智能能完成整件工作,就能化身为工种,大规模商用就有可能了,包括了家内服务陪伴的机器人、工厂内的工人、街道上的环卫巡逻快递机器人等等。

第三个等级,物种级别的具身智能。物种和工种的区别是什么呢?从一个视角,人类的文明就是由无数人类个体的,一个个行为目标堆砌而成的,在这之上,有一个认知和情绪决策的大脑决定了要做什么,一切的行为目标都来自于更高的动机的分解。

前面我们说现在的具身智能处在1.5的状态,也就是在完成各种行为目标上,现在的具身智能还无法做到泛化,只有在理想环境下能完成任务。

为什么这么难呢?因为在真实环境有无限的可能,就以导航去一个地方为例子,下楼梯可能电梯坏了、可能被人误导下错楼层、打车时,司机开一半有事要求其下车等等。所以无法靠编程预设。

那么如何从1.5做到2呢?需要有一个认知的大脑。遇到困境时,停下来思考基于我的处境可行的行为空间,为达到当前的目标,我下一步做什么。如果具身智能具备这种人类的慢速思考能力,就能够在预设训练以及预设经验的反应模式无法覆盖时,通过思考组织行为寻找突破,把任务向前推进。
我刚看到一个很疯狂的实验。
有人让 Claude 搭建了一个 “上帝视角” 终端: 里面有 56 个实时运行的 AI agents,用来模拟真实世界的市场参与者。
每个 agent 都有记忆、人格和行为模式, 会形成群体、产生意见领袖,并且实时改变观点。
@aigc1024

OpenClaw小龙虾🦞专属频道
@openclaw1024
清华最新的开源项目,OpenMAIC:AI多智能体互动课堂,给定任何主或文档,AI自动生成完整的互动课程
有趣的是,里面有AI老师和AI同学,类似真实的虚拟教室,不止有AI老师讲课,还有AI同学陪学
集成了OpenClaw,可以直接在飞书、Slack、Telegram里生成课堂
给定主一键生成课堂内容,包括幻灯片讲义、测验、HTML交互式模拟、项目制学习(PBL)
课堂中的AI老师和AI同学可以
语音讲解
在白板上画图、写公式
主动发起讨论或点名让学生发言
进行圆桌辩论
OpenMAIC相当于一个AI原生的教育基础设施,从慕课看视频时代升级到了和AI 一起上课的虚拟课堂时代
@aigc1024

OpenClaw小龙虾🦞专属频道
@openclaw1024
23年为什么看好机器人公司A:老板干过大项目,对战略有自己的判断逻辑且make sense部分形成了投资人共识,有资本的先发优势,且23年具身还没完全热
23年为什么看好公司B:B是做合成数据的,合成数据在机器人的很多传统场景已经有需求了,比如自动驾驶仿真之类的,具身时代模型更大之后只会放大这个需求,且当时已经有一些预订单;老板经验丰富,有业界资源
企业ai化变革,首先是政治问题,然后是业务问题,最后才是技术问题

政治问题也是利益分配的问题,旧的利益格局被打破,很多人从有用的状态直接被斩杀到无用的状态,为了保住自己的饭碗、自己的利益,得反对改革。

业务问题是原有的工作模式是否有流程化,还有数字化的基建。流程和数据都没有,是没法实现AI化的。 毕竟AI本质也只是提高了效率,原有的商业模式如果出了问题,效率再高也是徒劳。


@aigc1024

OpenClaw小龙虾🦞专属频道
@openclaw1024
1. 📢 你不知道的内幕消息
一些你不知道的内幕消息,最新资讯、大公司负面、时政财经、网友发布等高质量消息。

2. 📢 互联网从业者充电站
互联网从业者专属
内容多为技术、产品、设计、运营等不同话题内容;

3. 📢 出海🚢&自媒体运营秘籍
分享出海经验、赚美金、运营技巧、小红书运营、网赚项目等。

4. 📢 中年人生存报告
关于职场、生活、创业、30+、失业等一些记录

5. 📢 金融·投资·Web3加密货币·美股
Web3加密市场、美股、金融投资,理财,金融知识;

6. 📢 你不知道的冷知识
有趣的、无趣的、有用的、没用的知识

7. 📢 优质信息收藏夹
优质软件/插件/网站等分享。好玩的、好用的数字产品分享。

8. 📢 每日吃瓜
每日吃瓜消息爆料。

9. 📢 副业赚钱探索指南
分享实用的赚钱策略,发现那些隐藏的赚钱宝藏。

10. 📢 草台班子世界
社会观察、奇闻视频、突发事件和生活短片。
AI时代日新月异,您的孩子们未来学什么? 华尔街日报最新调查:硅谷AI大佬们的小孩,在学什么?
@aigc1024

OpenClaw小龙虾🦞专属频道
@openclaw1024
即梦+豆包AI指令,上万组提示词终极合集
🔗https://pan.quark.cn/s/9f92e7f44155
@aigc1024

OpenClaw小龙虾🦞专属频道
@openclaw1024
做了一个月投放之后我发现一个很反直觉的事情:投放的瓶颈根本不在投放,在素材。素材的瓶颈也不在创意本身,在生产效率。

你脑子里有再多想法,一周只能产出五条成品素材,就永远跑不过平台的疲劳周期。算法需要持续被喂新内容,而传统的制作流程:从脚本到拍摄到剪辑到上传,天然就是慢的。

这个结论是交了学费之后才想明白的。

一个月前我连Meta Ads Manager都没打开过。做了十年产品/工程/自然营销,从来没花过一分钱买流量。CPR这个词我第一反应是心肺复苏,attribution window怎么设不知道。然后因为团队调整,增长投放这件事突然落到了我手上。六位数的月预算,跑了两年的campaign架构,一整
套我完全看不懂的广告后台,需要有人马上接手,没有过渡期。

创业公司就是这样,事情来了你就得上。

接手之后做的第一件事不是学怎么建campaign(meta ads manager真的巨巨巨难用),是把过去两年的数据全翻了一遍。翻完发现一个很刺眼的事实:历史上花在网红渠道的钱,算到最终付费用户,单个成本是四位数美金。而同一时期,一个外包UGC创作者一条视频一百多美金,跑出来的注册成本比整个网红项目加起来还低,观众留存率是所有素材里最高的💀💀💀

这个对比太明显了,它直接决定了接下来一个月的方向:传统渠道上补人,AI把UGC素材的生产效率升量级。

首先决定的是:素材全是AI生成的。我们同时起了五个campaign,每个campaign塞不同风格的角色和场景,想的是快速铺开看哪个方向有信号。头几天确实有几条素材跑出了还不错的数据,会觉得好像方向对了,开始有一点兴奋。然后两周之内全部崩了。五个campaign,每一个都在同一个时间段进入了素材疲劳。花费断崖式下降,转化几乎归零。最差的那一周,所有campaign加起来跑了整整七天,回来的注册个位数。看后台的时候真的会开始怀疑,AI生成的素材到底能不能转化?

后来复盘的时候才发现,公司内部文档里团队其实早就写过一份文档,把我们踩的每一个坑都预判到了。单一内容形式会快速消耗受众注意力,重复同一种风格只会加速疲劳,top-of-funnel的观众根本不想看产品demo。我们犯的不是AI的错误,是内容策略的错误,只不过用AI角色把传统的坑重新踩了一遍。
AI探索指南
Photo
想明白这件事之后,第二代素材完全换了做法。不再只有一种格式,而是同时测POV视角、reaction,hook、多素材混剪。角色也不再单一,测试纪律拉起来👉每条素材给一小笔预算,48小时看数据,达标就放大,不达标就杀掉,不跟任何一条素材谈感情。这个框架跑起来之后,数据慢慢回来了。某些hook风格的点击率接近20%,特定角色加场景的组合在持续找到自己的受众。从噪音里开始能听到信号了。

这就是开头说的那个判断开始变清晰的时刻。

GEN2证明了AI素材是能转化的,但同时也证明了一件事:素材的生命周期比我想象的短得多。一条好素材可能只有几天的黄金期,之后就进入衰减。你不是在做"几条好内容",你是在跟一个永远在消耗的系统赛跑。能赢的唯一方式就是让生产速度远远超过消耗速度。

所以接下来三周,我把几乎所有精力砸在了工具上。我们用Claude Code从零搭了一整套AI素材生产系统: 完整的、任何团队成员都可以直接调用的技能包体系。

举个具体🌰:假设我们在TikTok上看到一条爆款视频,觉得这个hook有意思想复用。在以前,这是一个需要看几遍、截图、写文档、开会讨论、再让剪辑师理解你意思的过程。现在的流程是:把链接丢进Claude Code的视频理解技能,它自动下载、拉字幕、做镜头分析、跟画面内容交叉比对,输出一份结构化的拆解报告,这条视频的开头三
秒用了什么情绪触发、文字出现在第几帧、转折点在哪里、哪些元素是可以迁移到我们产品的。拿着这份拆解,喂给prompt生成技能。这个技能通过一个变量矩阵——角色乘以场景乘以hook类型乘以CTA结尾——一次性输出二十条视频prompt变体。每一条都不一样,但都是基于同一个经过验证的结构生成的。

🌟创意思考被前置到了系统设计层面,到了生成环节就是纯粹的执行。

生成完的视频丢给组装技能,自动把hook片段、正片内容、CTA结尾拼在一起,叠上logo、字幕、标签,位置和尺寸根据视频分辨率自动算好。出来就是可以直接传到广告后台的成品。

角色一致性的问题也解决了。AI视频最头疼的就是character drift——你的角色换个镜头就长得不一样,观众一眼就能看出来是AI。我们在Kling和Seedance上搭了一套角色身份库,每个角色是
一个JSON文件,锁定五官比例、肤色、体型、发型、标志性配饰,生成的时候挂载上去,几十条视频里同一个人保持一致。

投放数据那头也接上了。Meta广告数据自动拉回来,按创意变量拆分:哪个角色在转化、哪个场景成本最低、哪种hook类型点击率最高。制作团队不需要猜下一批做什么,看这张表就知道算法在告诉你什么东西在起效。

整条链路走通之后,一个下午可以完成从"这条TikTok火了"到"这里有二十条基于它为什么火而生成的广告变体"的全流程。这在一个月前是不可能的事情。

但工具只是一半。另一半是用这套工具的人。这可能是这一个月里我最想说的部分。

我们招了四个人进ABG Army。三个年轻人,一个资深视频剪辑师。四个人没有一个碰过Claude Code,没有一个写过任何AI工作流。有一个进来的时候连终端都没打开过,不知道命令行是什么。

我没有给他们上课。没有做培训PPT,没有搞什么"AI入门三天速成"。方式很简单也很残酷,直接给真实任务、真实deadline,遇到不会的现场查现场解。每天一起搭,每天一起踩坑,每天收工的时候比早上多会一点东西。

现在团队有了固定的周度投放复盘节奏,campaign数据和创意策略在同一张桌子上看。有agency partner接进来跑同一套数据流。有一条能从爆款拆解一路走到批量生成的素材管线。有一个虽然只有几个人但每个人都能独立搭工具的团队。

这些东西三十天前全部不存在。

当然我们还差得很远。素材疲劳的周期还是比我想要的快。注册之后的漏斗追踪有缺口,意味着我们对用户从注册到付费这段路径的理解还是模糊的。我不知道的东西,大概比我现在意识到的要多得多。

但机器在转了。数据在流,素材在出,团队在长。每周回头看上一周,都会觉得上周的自己挺蠢的。这大概就是对的方向。

虽然才30天,但我们才刚刚开始💜

(100%原创,如有任何行为的转发,必须经过本人同意)
Seedance2.0在个人vlog上表现还是很出色的,特别是运镜、转场、
氛围感、细节上面,做这种要求不高的娱乐视频还是轻轻松松的。
但是还是会有一些小问,比如配音不对(我把原片放出来了,第二个视频,这里面旁白是从哪冒出来的😂)字幕和清晰度的问也经常被诟病。
如果是商业视频,客户要求可能是100分,各种细节要各种抽卡才能解决,这个在目前还是比较难突破,特别是算力太紧了
这个提示词我放到这里了,需要的自取👇
@aigc1024

OpenClaw小龙虾🦞专属频道
@openclaw1024
最近国家数据局给出的统计数据是,3月中国日均Token调用了超过140万亿。

昨天晚点LatePost又发了报道,字节豆包大模型的日均Token调用量在3月超过了100万亿。

我们假设两个数据都是成立的,那么岂不是豆包一家就占到了中国大模型整体消耗量的70%以上?

当然豆包大模型也可以有海外的调用量,但从市场表现来看,不会太多。

再就是口径问题,豆包的100万亿日均调用量,出自火山引擎,这个相对来说是比较清晰的。

国家数据局和其他政府机构一样,基本只给结论,不谈样本,用常识判断的话,它的信息是各家大模型公司上报过去的,没有自己的统计渠道。

所以就造成了解读上的不够精确:

全中国140万亿的日均调用量,是基于什么汇报口径?

同样是Tokens消耗,模型App是一个数,模型底座是一个数,云又是另一个数,而且云还得看是不是MaaS⋯⋯

不说清楚的话,理解偏差就会很大。

当然豆包模型的消耗占比偏大的原因也有合理性,就是全模态,同样是用ChatBot,你搁那问五分钟的交互消耗,和跟豆包打语音开视频相比,区别不是一般的大。

这也是豆包比较「占便宜」的地方,按照AI时代的北极星指标要从月活/日活变成用量这个暴论的说法,豆包和其他国产大模型的差距,比月活/日活的差距是要更大的。

火山引擎还提了一个点,就是Seedance模型在被广泛用在AI漫剧产业,AI漫剧的制作商在投入上相对充裕,从即梦等2C产品用户使用Seedance排队越来越痛苦也能察觉到,字节是在优先保障企业级付费用户的使用,叠加起来就是「极大带动了Token的消耗增长」。

但Seedance应该不会算在豆包大模型的调用量里,这个可以排除。

总之豆包这闷声上大分的成绩,是有点细思恐极的,不怕兄弟苦,就怕兄弟开路虎啊。
让 AI 好好干活儿,把事情做好,一句扔给它显然是不够的。一句来,一句去,会让 AI 陷入到细节。陪伴式地结对编程,对人的消耗也特别大。
最高效的方式是,将任务分成两个阶段,第一阶段打磨框架,第二阶段做精细化调优。
前者需要人类想清楚事情的目标,以及产品服务的供给方式,给 AI 做好任务规划,让它可以大把大把吃 token;后者需要对 AI 执行结果做编排和重构,更多是为了对齐人类目标和 AI 理解之间的偏差。
因此,对 AI 的管理,需要两块能力,一是需求管理能力,包含了对需求的分门别类、需求的拆解和细化、需求的优先级打标管理等,这是传统 PM/TL/PD 常干的事儿;二是让 AI 并行工作的能力,这会涉及到 AI 之间的合作与协同,AI 之间需要分派指令、执行任务、回馈结果,也需要经常性地解决冲突。
当每个人都配备多个 AI Agent
的时候,如何管理 AI 会是一门新的学问,德鲁克老爷子提出的很多思想,在 AI 时代又需要进化啦😄
@aigc1024

OpenClaw小龙虾🦞专属频道
@openclaw1024
Back to Top