AI探索指南

关于AIGC人工智能、思维方式、知识拓展，能力提升等。投稿/合作： @inside1024_bot
AIGC 领域的最新工具、开源项目以及行业大事件

梦里啥都有的AI创意，昨天很多二次元群友的挽尊之作：带喜欢的Coser吃海底系列。
提示词：
一张随意用 iPhone 拍摄的快照，拍到一位女性角色扮演者正在精确地还原参考图中的角色。
要求极其严格的身份匹配：相同发型、相同双马尾、相同的发色渐变、相同的发饰、相同的耳朵、完全相同的服装结构、相同的角色气质。面部结构必须严格遵循原角色的比例和特征——高度可辨认为该角色，而不是普通的漂亮脸蛋。
面部：非常吸引人但自然，动漫写实风格的美感，能看到毛孔并有轻微磨皮效果，淡淡的自然妆感，面颊和鼻子有轻微腮红，因吃火锅而皮肤略显油光和光泽，因温度产生轻微泛红，有些小瑕疵（轻微汗水、肤质不均），不会过度完美。
表情：她注意到相机，略微转头朝向镜头，有轻微反应并做出一个小而随意的动作（比如快速的胜利手势或淡淡的微笑），表情仍然自然，不做作，眼神短暂看向镜头但并非刻意摆拍，感觉像是瞬间的友好回应，而不是拍摄中的摆拍。
发型：因热气和动作稍微有些凌乱，几缕头发粘在脸颊或脖颈上，带有自然的运动模糊，坐着时略微塌陷。
服装：完全忠实于原始设计，真实面料有真实的褶皱，因坐着和用餐略有错位，细节有小幅移动。
姿势：身体略朝向镜头转动，一只手仍拿着筷子或放在桌上，另一只手随意做出小动作（胜利手/轻挥手），身体姿态放松自然，不是完整摆拍，仅是迅速反应。
场景（重要）：海底捞火锅餐厅，角色扮演者坐在另一张桌子（隔桌或斜对面），靠近墙边或卡座，背景相对干净（墙板/镜面），她仍与自己的同伴一起用餐。
环境：靠墙的干净就餐区，柔和的墙面灯光，热气轻微冒起，桌上有肉盘、饮料、蘸料。
构图（非常重要）：有种从你自己桌子拍摄的感觉，主体不居中，略微拉近、有些别扭的裁切，身体部分稍被截断。
前景（极其重要）：你自己的桌子占据前景主位，火锅、汤、筷子、盘子清晰可见，桌沿挡住画面下方，你的手臂或肩膀部分遮挡视线，另一位食客轻微挡住画面，前景略微虚焦。
相机：构图欠佳，稍微倾斜，有轻微的动态模糊，焦点略偏，能看到颗粒感和 JPEG 压缩伪影（类似微信风格），镜头有污渍/油性模糊，手指微微遮住角落。
灯光：室内混合光源（暖黄光 + 柔和白光），曝光略不均匀，靠墙的灯光比大厅中心更柔和，皮肤和桌面有反光，热气使光线有扩散效果。
额外真实感：轻微的热气在主体前方流动，背景有细微的运动模糊，存在小规模遮挡（杯子/手臂/筷子挡住部分区域）。
氛围：你在正常用餐，同桌有一位高度

2 天前

小红书可以直接上传 Skill 了，这个太屌了，感觉是个很大的事件。
@aigc1024

2 天前

最近好像 Claude Code 连接飞书又火了
再推荐一下藏师傅两个多月前写的这个 Skills 哈。
它能连接 Telegram、飞书、QQ、微信、Discord 等各种 IM，支持 Claude Code 和 Codex
详情：github.com/op7418/Claude-to-IM-skill
@aigc1024

2 天前

Anthropic的年化收入：
1月：90亿美金
2月：140亿美金
3月：190亿美金
4月：300亿美金
5月：450亿美金
人类历史上从来没有出现过的收入增长。
@aigc1024

2 天前

刚刚结束的疯享交流，意犹未尽。AI 产品不只被讲出来，还真的被拿到现场展示、体验了。
有人带来灵巧手，有人带来3D空间扫描产品，还有数字分身上传、AI营销工具、体态筛查等产品在现场被分享。
今晚我们没聊空泛趋势，而是在做几件很具体的事：
💡先上手，再提问；
💡先体验，再反馈；
💡先看产品到底能不能用，再问它下一步该怎么改。
现场最有意思的部分，往往发生在体验之后。有人在台上讲产品，有人在台下认真试，Z世代AI创业者拿着“酒杯”合照，记录下今晚这场酣畅淋漓的相识。
北京站是一场真实互拆。深圳站则是一场直接上手的产品现场。
这就是 AI Next社区想做的事：让正在做AI产品的人，遇见彼此，彼此相助，共同成长。
如果你也正在做 AI 应用 / 硬件 / 垂直模型 / 具身智能，关注青腾公众号，留言你所在的城市。6月见。
@aigc1024

2 天前

WaytoAGI联合红杉中国开启AGI House第一季：招募Builder入驻
@aigc1024

2 天前

WaytoAGI联合红杉中国开启AGI House第一季：招募Builder入驻
@aigc1024

2 天前

今天我们发布了 ColaOS，第一个有灵魂的 Agent OS。
这大概是我这辈子做过的最难做的一个产品了。
我们从 2024 年创业之初，就想做一个可以用自然语音交互的 Voice Agent，但是创业第一年真的好难，时代的发展也还未到，我们根本无法做出来，只能先把语音的部分先做完，也就是 ListenHub。
2025 年去年 9 月，我们拿到了第二轮融资，正式立项 Voice Agent，可依然困难重重。方向模糊，团队纠结，认知不到位，技术不支持...我们只能默默积累认知，积累技术。
直到今年 2 月，我觉得技术到位了，我的认知到位了，我找到团队，说出了全面回归初心 All In Agent 的想法，我们迅速默契地达成了共识。
整个团队，心无旁骛，全速冲刺。
五周时间，我们终于，做出来了。
她叫 ColaOS。
来看个视频，认识一下她吧。
她背后的故事，都在这里
https://mp.weixin.qq.com/s/LypPv3wTqvW65HZHP6wvtg
@aigc1024

2 天前

看晚点对豆包的报道，还是挺感慨的
豆包赢下了 AI chatbot 的胜利
只是这场胜利的价值几何，没有人能衡量
一些有趣的点：
朱骏在 2024 年 5 月的演讲中特意提到，豆包已经拥有 800 万个智能体。这次尝试没过多久便失败了。一段时间过后，团队发现除了 “豆包” 这个主智能体以外，其它智能体的用户活跃度都不高。
他们做了一次实验，将豆包以外的智能体全部下架，结果用户活跃、留存没有受到任何影响。
2024 年上半年，豆包的 “多 bot” 尝试受挫后，团队一度陷入迷茫，开始寻找新的突破口。他们曾考虑根据用户在豆包对中表达的兴趣进行主动的内容推荐，推荐内容包括抖音短视频，类似后来 ChatGPT 做的 Pulse，但最终决定不上线。
一位知情人士说，当时豆包对用户留存不满，所以想借抖音这款公司留存最好的产品来提高数据，“有些病急乱投医”。
抖音的单用户日均使用时长曾经从 30 分钟涨到 120 分钟，而豆包仍稳定在 10 分钟以内，尚不足以对传统的互联网产品造成威胁。
@aigc1024

2 天前

AI 发展的里程碑时刻。
OpenAI 的一个未公布的内部推理模型，自主解决了 Erdős 1946 年提出的平面单位距离问。
chain of thought 长达125 页，核心手法是从代数数论拉了一套工具去解离散几何问，这个跨领域连接是人类 80 年没想到的。
最有意思的是这个模型不是专门为数学训练的，是通用推理模型。
这说明足够强的推理能力到了某个阈值之后，创造性会自然涌现。
恭喜人类。
https://openai.com/index/model-disproves-discrete-geometry-conjecture/
@aigc1024

2 天前

有些问在今天的答案已经非常非常明显了
比如你做的事情壁垒在哪里，字节抄你怎么办这种问
就以非常实际的例子来说
Kimi 做了 coding 能力很强的模型，如果字节也做了，会怎样？
其实不会怎样啊，Kimi 该上市就上市，不会受到任何影响
而更早之前的 minimax 和智谱都已经上市了
他们有什么是大厂做不了的东西吗？
manus arr 都要冲刺 10亿美金了
大厂抄一个完全一样的又怎样呢
这些问在增量世界里就是一种忆苦思甜
@aigc1024

2 天前

看完了 Anker CEO 阳萌在晚点的访谈，一些有趣的片段：
1. 招不到最好的人不是人力总监的问，是做的事情不够难。大家一听做充电宝，最厉害的人肯定不会来。
2. 激进的保守主义者：10 块钱投 5 块，挣了 20 回来，有 25 块再投一半。盘子越来越大，但每次只投一半。
3. 不要盯着竞争，不要盯着过去，回到用户的极致需求。
4. 首先分配的是机会，根据价值观分配机会，根据结果分配回报。
5. 先推动几个团队做出来，然后大家就会跟上。中国人不一定羡慕别的公司，但一定羡慕同一拨进公司的人。
6. 一个事情做成需要不同的品质，出现在一个人身上非常珍贵，两个人各有一半就互补。阿里叫雌雄同体，华为叫狼狈同行。
7. 奔驰主打豪华，宝马主打驾驶乐趣，奥迪主打科技，竞争的终局是纳什均衡，不是你死我活。
8. 把公司当成产品，把"创造者的乐园"搭好，活很多年，我就是个非常好的产品经理。
9. 关注现在和未来，过去不好的经历都忘掉了。所以吵架必输。
10. 如果一个人最后做的事情不开心，这肯定不对。
https://mp.weixin.qq.com/s/5QKj6WJzY7L_U43pQ6j54g?scene=1
@aigc1024

Before

After