关于AIGC人工智能、思维方式、知识拓展,能力提升等。投稿/合作: @inside1024_bot
AIGC 领域的最新工具、开源项目以及行业大事件
AIGC 领域的最新工具、开源项目以及行业大事件
1. 📢 你不知道的冷知识
有趣的、无趣的、有用的、没用的知识
2. 📢 优质「信息」收藏夹
优质内容/信息/软件/插件/网站等分享,好玩的、好用的数字产品分享,提高你的信息获取质量。
3. 📢 🍉 每日吃瓜【人间观察实录】
观世间万象,品人情冷暖。看热闹不嫌事大,聊八卦与有荣焉。【人间观察实录】
4. 📢 副业赚钱探索指南
深入探讨各种副业机会,分享实用的赚钱策略,发现那些隐藏的赚钱宝藏,提高你的赚钱认知。
5. 📢 草台班子世界
社会观察、奇闻视频、突发事件和生活短片。
6. 📢 沙雕日常图鉴
分享沙雕、擦边、直播闪现、尬图等。
7. 📢 AI探索指南
AIGC 领域的最新工具、开源项目以及行业大事件,AIGC人工智能、思维方式、知识拓展,能力提升等。
8. 📢 🦞OpenClaw小龙虾
分享OpenClaw🦞最新玩法、技巧、经验、观点等。
9. 📢 优质「资源」收藏夹
收藏高质量书籍、资料、资源,帮助你获取优质资源。
10. 📢 你不知道的内幕消息
一些你不知道的内幕消息,最新资讯、大公司负面、时政财经、网友发布等高质量消息。
有趣的、无趣的、有用的、没用的知识
2. 📢 优质「信息」收藏夹
优质内容/信息/软件/插件/网站等分享,好玩的、好用的数字产品分享,提高你的信息获取质量。
3. 📢 🍉 每日吃瓜【人间观察实录】
观世间万象,品人情冷暖。看热闹不嫌事大,聊八卦与有荣焉。【人间观察实录】
4. 📢 副业赚钱探索指南
深入探讨各种副业机会,分享实用的赚钱策略,发现那些隐藏的赚钱宝藏,提高你的赚钱认知。
5. 📢 草台班子世界
社会观察、奇闻视频、突发事件和生活短片。
6. 📢 沙雕日常图鉴
分享沙雕、擦边、直播闪现、尬图等。
7. 📢 AI探索指南
AIGC 领域的最新工具、开源项目以及行业大事件,AIGC人工智能、思维方式、知识拓展,能力提升等。
8. 📢 🦞OpenClaw小龙虾
分享OpenClaw🦞最新玩法、技巧、经验、观点等。
9. 📢 优质「资源」收藏夹
收藏高质量书籍、资料、资源,帮助你获取优质资源。
10. 📢 你不知道的内幕消息
一些你不知道的内幕消息,最新资讯、大公司负面、时政财经、网友发布等高质量消息。
架构:Claude Code → Bridge Daemon(Python)→ M5Paper(蓝牙/USB)
协议:JSON 行分隔,向后兼容
中文支持:3.4MB TTF 字体,专门写了 codepoint-aware 的 wrapText
======
和 Anthropic 官方项目的区别
Anthropic 的 claude-desktop-buddy 是单会话、只显示状态、不支持审批。主要用来显示 Buddy 的状态,是个好玩的玩具。
M5 Paper Buddy 支持多会话、触屏切换、物理按键审批、蓝牙远程控制。增强了工具属性,而且利用了 M5 Paper 设备的大屏幕。
Anthropic 官方项目用的也是 M5Stack 硬件。开源协议、开源代码,天天敌视国内涉及到硬件还得用国内生态。
======
手机小组件的"物理化"
这个项目本质上是"手机小组件的物理化"。
手机小组件只能"显示信息",不能"交互"。你不能在小组件上按按钮、不能语音回复、不能触屏操作。
如果把它做成物理设备:可以有按键和触屏、"永远亮着"(墨水屏不耗电,断电保持显示)、不依赖手机屏幕,但和手机/电脑的 AI Agent 保持连接。
形态可以很多样:磁吸在手机背面、挂在背包上(像挂件)、放在桌上(像桌面陪伴)
------
现在的 M5 Paper Buddy 只有墨水屏 + 按键。但未来可以加语音交互。
无论你在哪里,它都能主动告诉你信息,然后你再回复。这比"看屏幕 + 按按钮"更符合真实场景。
物理按键和语音不是替代关系,而是互补。按键适合快速确认,语音适合复杂交互。真正的"陪伴"应该是:无论你在哪里,它都能主动告诉你信息。
======
做这个项目的过程中,我发现了一些有意思的事
其实这些技术都不新。墨水屏、蓝牙、触摸屏都是成熟技术,M5Stack、Arduino 这种模块化硬件也早就有了。但为什么以前没人做这种东西?
我觉得是因为做硬件的和做 AI 的是两拨人。做硬件的(苹果、三星)关心怎么卖更多手机,不关心"AI Agent 状态监控"。做 AI 的(OpenAI、Anthropic)关心模型能力,不关心硬件形态。两拨人不说话。
但现在不一样了。
------
我做这个项目的时候,几乎没碰过硬件开发。以前做硬件需要懂电路设计、画 PCB、读几百页的 datasheet。现在 M5Stack 买回来就能用,官方提供完整的库和示例代码。遇到问题,AI 可以帮你读 datasheet、写驱动、调试代码。
更重要的是深圳供应链。全球的 AI 硬件项目都绕不开这里。Anthropic 的 claude-desktop-buddy 用的也是 M5Stack 硬件。快速打样(1-2 周)、小批量量产、成本低(M5Paper ¥500)。做 AI 的人可以很快出一个 Demo,去跟做硬件的人沟通交流。
再加上 3D 打印(拼多多几百块就能买到打印机),你可以做出很精致的外壳。社区有大量开源模型(Thingiverse、Printables)。
所以现在做 AI 的人可以做硬件了。个人开发者可以先做出来,大公司还在立项。
======
前几天 OpenClaw(龙虾)火了
我看到很多人在讨论为什么 OpenClaw 会火。我觉得有几个原因:开源(所有人都能改)、可玩性(不只是"有用",而是"好玩")、低门槛(模块化 + AI 辅助开发)。
M5 Paper Buddy 也是这个思路:开源(GPL-3.0)、可玩性(桌面陪伴、物理审批的仪式感)、低门槛(两条命令:/buddy-install + /buddy-start)。
AI 和物理世界的交互,不应该只有机器人、自动驾驶这种"大硬件"。这种模块化的小硬件,门槛低得多,可玩性也强。再搭配 3D 打印,会有不少玩法。
======
大公司肯定会做这种东西
Anthropic 已经开源了 claude-desktop-buddy 项目,用的也是 M5Stack 硬件。看起来他们想让生态参与进来。苹果可能会做 MagSafe AI 配件,Google 可能会做 Pixel AI 配件。
但大公司慢。做硬件需要供应链、认证、渠道,从立项到上市至少 1-2 年。以前他们没做,可能是因为比较迟钝,而且做硬件和做 AI 的是两拨人。
所以现在有个窗口期。个人开发者可以先做出来,开源社区可以先验证概念。等大公司做出来,社区已经有成熟方案了。
======
物理化的 AI 触点
我觉得 AI 的下一步不只是更强的模型,还有物理世界的交互。不只是机器人、自动驾驶这种"大硬件",也包括桌面小设备、可穿戴设备、手机配件这种"小硬件"。
M5 Paper Buddy 是一个例子。把 AI 的状态和决策"物理化",让手机小组件从屏幕里走出来。
你的桌上可能有一个"AI 监工"(墨水屏 + 按键)。你的手机背面可能有一个"AI 小组件"(磁吸 + 触屏)。你的背包上可能有一个"AI 挂件"(语音 + 震动)。这些可能都不是大公司的产品,而是开源社区的创作。
如果你手头有开发板,不妨试试做点什么。
协议:JSON 行分隔,向后兼容
中文支持:3.4MB TTF 字体,专门写了 codepoint-aware 的 wrapText
======
和 Anthropic 官方项目的区别
Anthropic 的 claude-desktop-buddy 是单会话、只显示状态、不支持审批。主要用来显示 Buddy 的状态,是个好玩的玩具。
M5 Paper Buddy 支持多会话、触屏切换、物理按键审批、蓝牙远程控制。增强了工具属性,而且利用了 M5 Paper 设备的大屏幕。
Anthropic 官方项目用的也是 M5Stack 硬件。开源协议、开源代码,天天敌视国内涉及到硬件还得用国内生态。
======
手机小组件的"物理化"
这个项目本质上是"手机小组件的物理化"。
手机小组件只能"显示信息",不能"交互"。你不能在小组件上按按钮、不能语音回复、不能触屏操作。
如果把它做成物理设备:可以有按键和触屏、"永远亮着"(墨水屏不耗电,断电保持显示)、不依赖手机屏幕,但和手机/电脑的 AI Agent 保持连接。
形态可以很多样:磁吸在手机背面、挂在背包上(像挂件)、放在桌上(像桌面陪伴)
------
现在的 M5 Paper Buddy 只有墨水屏 + 按键。但未来可以加语音交互。
无论你在哪里,它都能主动告诉你信息,然后你再回复。这比"看屏幕 + 按按钮"更符合真实场景。
物理按键和语音不是替代关系,而是互补。按键适合快速确认,语音适合复杂交互。真正的"陪伴"应该是:无论你在哪里,它都能主动告诉你信息。
======
做这个项目的过程中,我发现了一些有意思的事
其实这些技术都不新。墨水屏、蓝牙、触摸屏都是成熟技术,M5Stack、Arduino 这种模块化硬件也早就有了。但为什么以前没人做这种东西?
我觉得是因为做硬件的和做 AI 的是两拨人。做硬件的(苹果、三星)关心怎么卖更多手机,不关心"AI Agent 状态监控"。做 AI 的(OpenAI、Anthropic)关心模型能力,不关心硬件形态。两拨人不说话。
但现在不一样了。
------
我做这个项目的时候,几乎没碰过硬件开发。以前做硬件需要懂电路设计、画 PCB、读几百页的 datasheet。现在 M5Stack 买回来就能用,官方提供完整的库和示例代码。遇到问题,AI 可以帮你读 datasheet、写驱动、调试代码。
更重要的是深圳供应链。全球的 AI 硬件项目都绕不开这里。Anthropic 的 claude-desktop-buddy 用的也是 M5Stack 硬件。快速打样(1-2 周)、小批量量产、成本低(M5Paper ¥500)。做 AI 的人可以很快出一个 Demo,去跟做硬件的人沟通交流。
再加上 3D 打印(拼多多几百块就能买到打印机),你可以做出很精致的外壳。社区有大量开源模型(Thingiverse、Printables)。
所以现在做 AI 的人可以做硬件了。个人开发者可以先做出来,大公司还在立项。
======
前几天 OpenClaw(龙虾)火了
我看到很多人在讨论为什么 OpenClaw 会火。我觉得有几个原因:开源(所有人都能改)、可玩性(不只是"有用",而是"好玩")、低门槛(模块化 + AI 辅助开发)。
M5 Paper Buddy 也是这个思路:开源(GPL-3.0)、可玩性(桌面陪伴、物理审批的仪式感)、低门槛(两条命令:/buddy-install + /buddy-start)。
AI 和物理世界的交互,不应该只有机器人、自动驾驶这种"大硬件"。这种模块化的小硬件,门槛低得多,可玩性也强。再搭配 3D 打印,会有不少玩法。
======
大公司肯定会做这种东西
Anthropic 已经开源了 claude-desktop-buddy 项目,用的也是 M5Stack 硬件。看起来他们想让生态参与进来。苹果可能会做 MagSafe AI 配件,Google 可能会做 Pixel AI 配件。
但大公司慢。做硬件需要供应链、认证、渠道,从立项到上市至少 1-2 年。以前他们没做,可能是因为比较迟钝,而且做硬件和做 AI 的是两拨人。
所以现在有个窗口期。个人开发者可以先做出来,开源社区可以先验证概念。等大公司做出来,社区已经有成熟方案了。
======
物理化的 AI 触点
我觉得 AI 的下一步不只是更强的模型,还有物理世界的交互。不只是机器人、自动驾驶这种"大硬件",也包括桌面小设备、可穿戴设备、手机配件这种"小硬件"。
M5 Paper Buddy 是一个例子。把 AI 的状态和决策"物理化",让手机小组件从屏幕里走出来。
你的桌上可能有一个"AI 监工"(墨水屏 + 按键)。你的手机背面可能有一个"AI 小组件"(磁吸 + 触屏)。你的背包上可能有一个"AI 挂件"(语音 + 震动)。这些可能都不是大公司的产品,而是开源社区的创作。
如果你手头有开发板,不妨试试做点什么。
现在做硬件的门槛是真低啊,USB一插让Claudecode跑就行
详情:https://github.com/op7418/m5-paper-buddy
AI 和物理世界的交互,不应该只有机器人和自动驾驶这种"大硬件"。
前几天我给 Claude Code 做了个墨水屏监工,能蓝牙连接电脑,监控所有对话状态,还能用物理按键审批操作。
做着做着发现,这其实是"手机小组件的物理化"——一个被忽视的巨大空间。
M5 Paper Buddy 能做什么?
------
多会话 Dashboard
所有 Claude Code 窗口的状态显示在一个墨水屏上。每个会话显示:上下文使用量(45.8K / 200K)、模型(Opus 4.7)、项目名、分支、dirty 文件数。
触屏点击可以切换关注的会话,右侧显示该会话的详细信息(最近回复、活动日志)。
比如我在写 AIGC Weekly 时,同时跑 3 个项目。看一眼就知道每个的进度,以及他们当前的状态。
M5Stack 是一个以模块化、积木式堆叠设计闻名的 ESP32 开源物联网硬件生态,而 M5Paper 则是该生态中一款专为低功耗信息看板打造的触控墨水屏极客终端。
------
物理按键审批
Claude Code 需要你在终端里审批操作。M5 Paper Buddy 把审批搬到物理按键上:
全屏显示审批卡:tool 名 + 项目 + 完整内容(bash 命令原文 / edit 的 diff / write 的文件预览)。PUSH 按钮同意,DOWN 按钮拒绝。审批记录在活动日志里留痕。
物理按键更有仪式感。尤其是 rm -rf、git push --force 这种高风险操作,按物理按钮会让你更慎重。而且你可以看到完整的 diff 或命令内容,不用在终端里上下翻页。
------
蓝牙远程控制
通过蓝牙连接电脑,可以离开书桌审批操作。
比如你在沙发上看书,Claude 在跑测试,突然需要审批一个 bash 命令。墨水屏在桌上亮了,拿起来按一下按钮就行。
配对后自动连接,断电保持状态。
======
技术实现
硬件:M5Paper V1.1(ESP32 + 4.7 寸墨水屏 + 3 个物理按键 + GT911 电容触屏)
分享Seedance 2.0规避真人审核方法。
1、图像预处理:风格化转译(最稳妥的方法)
系统目前最针对的是“高精度真人写实感”。可以先通过其他 AI 先将照片处理一下,通过概率非常高。
直接将人物上传到图生图,提示词为:
将上传的图片转成手绘/素描/线稿风格。
手绘/素描/线稿这些风格保留了人物的五官特征,Seedance 生成视频的时候可以取出人物神韵。
2、模糊/颗粒处理: 适当增加噪点或胶片质感,模糊皮肤纹理,避开系统对“生物特征”的高精度扫描。
3、构图逻辑:避开“证件照”
Seedance 的审核算法对正面、大头、静态、单一背景的图片极其敏感。
缩小人脸占比: 尽量提供全身照或环境人像。让脸部在整个画面中只占一小部分,且背景要复杂(如繁华街道、森林),这能干扰系统的肖像识别。
动态捕捉位: 使用运动中的照片(如奔跑、跳舞、侧身)。动作产生的自然形变和发丝遮挡会增加系统判定“真人”的难度。
增加遮挡: 佩戴墨镜、口罩或利用光影(侧光、阴影)遮住部分脸部。
以上方法均可通过AI图生图实现。
4. 设置陷阱:模式选择的技巧
首帧模式 :将照片直接放入“全局参考”大概率会被拦截;但如果将其作为“首帧”,不用添加尾帧,审核机制会相对宽松一点,因为系统会认为这是你要转换的“起点”而非永久参考。
5. 提示词的“去掉人名”
拆解特征: 即使你用了规避过的图,如果提示词里直接写了某个明星的名字,也会被拦截。建议将特征拆解,例如把“汤姆·克鲁斯”改为“深邃眼窝、鹰钩鼻、成熟自信的男士”。(不知道怎么描述,可以直接把明星图片扔给AI,让AI来描述)
AI探索指南 | Hermes爱马仕 & OpenClaw小龙虾🦞
1、图像预处理:风格化转译(最稳妥的方法)
系统目前最针对的是“高精度真人写实感”。可以先通过其他 AI 先将照片处理一下,通过概率非常高。
直接将人物上传到图生图,提示词为:
将上传的图片转成手绘/素描/线稿风格。
手绘/素描/线稿这些风格保留了人物的五官特征,Seedance 生成视频的时候可以取出人物神韵。
2、模糊/颗粒处理: 适当增加噪点或胶片质感,模糊皮肤纹理,避开系统对“生物特征”的高精度扫描。
3、构图逻辑:避开“证件照”
Seedance 的审核算法对正面、大头、静态、单一背景的图片极其敏感。
缩小人脸占比: 尽量提供全身照或环境人像。让脸部在整个画面中只占一小部分,且背景要复杂(如繁华街道、森林),这能干扰系统的肖像识别。
动态捕捉位: 使用运动中的照片(如奔跑、跳舞、侧身)。动作产生的自然形变和发丝遮挡会增加系统判定“真人”的难度。
增加遮挡: 佩戴墨镜、口罩或利用光影(侧光、阴影)遮住部分脸部。
以上方法均可通过AI图生图实现。
4. 设置陷阱:模式选择的技巧
首帧模式 :将照片直接放入“全局参考”大概率会被拦截;但如果将其作为“首帧”,不用添加尾帧,审核机制会相对宽松一点,因为系统会认为这是你要转换的“起点”而非永久参考。
5. 提示词的“去掉人名”
拆解特征: 即使你用了规避过的图,如果提示词里直接写了某个明星的名字,也会被拦截。建议将特征拆解,例如把“汤姆·克鲁斯”改为“深邃眼窝、鹰钩鼻、成熟自信的男士”。(不知道怎么描述,可以直接把明星图片扔给AI,让AI来描述)
AI探索指南 | Hermes爱马仕 & OpenClaw小龙虾🦞
Coding 从狭义的 coding 开始溢出到各个领域。
创造力大爆发。
AI 不会取代拥抱AI的人。
模型是未来的操作系统,十万亿级别的三个。
美好而乐观。
今天学习了一下什么是:人月神话
"人月神话"是 Fred Brooks 1975 年写的一本软件工程经典书,英文叫 The Mythical Man-Month。
核心意思就一句话:往一个已经延期的项目里加人,只会让它更慢。
因为"人月"这个单位本身就是个神话。管理者觉得一个人干十个月的活,十个人一个月就能干完,但实际上人一多,沟通成本指数级增长,新人还需要老人带,老人被拖慢,项目反而更晚交付。
Brooks 当时在 IBM 负责 OS/360 项目,踩了这个坑踩得死去活来,然后写了这本书。
五十年过去了,这个问题在AI时代反而更严重了。
因为以前加人好歹能分摊一些机械劳动。现在机械劳动agent干了,加人带来的几乎纯粹是沟通成本。
今天最好的模式是一人闭环。一个人加上agent,从想法到成品,中间不经过任何人。其次是两人闭环,再其次三人。
超过三个人,不管你怎么管理,都会陷入人月神话。
所以正确的做法是把大项目拆成一堆小项目,每个小项目最多三个人闭环。节点之间用协议连接,不用会议连接。
Brooks当年的结论是"没有银弹"。
五十年后银弹来了,但它不是让团队更大,而是让团队更小。
"人月神话"是 Fred Brooks 1975 年写的一本软件工程经典书,英文叫 The Mythical Man-Month。
核心意思就一句话:往一个已经延期的项目里加人,只会让它更慢。
因为"人月"这个单位本身就是个神话。管理者觉得一个人干十个月的活,十个人一个月就能干完,但实际上人一多,沟通成本指数级增长,新人还需要老人带,老人被拖慢,项目反而更晚交付。
Brooks 当时在 IBM 负责 OS/360 项目,踩了这个坑踩得死去活来,然后写了这本书。
五十年过去了,这个问题在AI时代反而更严重了。
因为以前加人好歹能分摊一些机械劳动。现在机械劳动agent干了,加人带来的几乎纯粹是沟通成本。
今天最好的模式是一人闭环。一个人加上agent,从想法到成品,中间不经过任何人。其次是两人闭环,再其次三人。
超过三个人,不管你怎么管理,都会陷入人月神话。
所以正确的做法是把大项目拆成一堆小项目,每个小项目最多三个人闭环。节点之间用协议连接,不用会议连接。
Brooks当年的结论是"没有银弹"。
五十年后银弹来了,但它不是让团队更大,而是让团队更小。
🚨马斯克说了一句让整个AI安全圈不安的:
你根本无法控制一个比你更聪明的东西。
他的类比很直接:想象你有一个天才孩子,你知道他终将远超你的智识水平——你能做什么?
不是规则,不是限制,不是紧急关闭按钮。
只有在他还小的时候,把正确的价值观装进去。
诚实、利他、有道德。
AI探索指南 | Hermes爱马仕 & OpenClaw小龙虾🦞
你根本无法控制一个比你更聪明的东西。
他的类比很直接:想象你有一个天才孩子,你知道他终将远超你的智识水平——你能做什么?
不是规则,不是限制,不是紧急关闭按钮。
只有在他还小的时候,把正确的价值观装进去。
诚实、利他、有道德。
AI探索指南 | Hermes爱马仕 & OpenClaw小龙虾🦞
2025年12月份,大玩家 赌神附体,狂揽一个亿,可自行验证
永久网址
🏆全网广告费每月投入高达500万
🏆平台优势:
1️⃣ #电子真人0审核包出款、#反水无上限
2️⃣ #巨额无忧,每日提款不限额度不限次数
3️⃣
4️⃣ #不限ip、#免实名,无需绑手机号、信息安全有保障
🏆Y3 国际 全站封神榜
➡️ 8月13号 神秘玩家仅用300u爆奖140万u,成功提款1088888u
➡️ 8月16号 反水1700u仅用80u爆奖54万u,成功提款60万u
➡️ 10月10号 大哥在PG麻将胡了爆奖260万u,成功提款210万u
➡️ 12月6号 神秘盘总PA真人豪赢400万u,成功提款370万u
👑#反水无上限 日提无上限 日出千万
👑#每日存款彩金每日送,每笔存款加赠
🌐官网注册链接: y3867.com
💖 Y3国际专属客服:@Y3VIP8888
➡️ 双向用户点击: @Y3VIP777_bot
✅ 更多优惠活动关注福利频道: @Y3VIP678
😃 爆庄实录|3天狂揽1086万U😃 新客首存1000,豪提120万U😃 500一拉,PG实力兑现133万U💵 亿万储备金,大额无忧
🇭🇰 香港六合彩,特码 55 倍