关于AIGC人工智能、思维方式、知识拓展,能力提升等。投稿/合作: @inside1024_bot
AIGC 领域的最新工具、开源项目以及行业大事件
梦里啥都有的AI创意,昨天很多二次元群友的挽尊之作:带喜欢的Coser吃海底系列。
提示词:
一张随意用 iPhone 拍摄的快照,拍到一位女性角色扮演者正在精确地还原参考图中的角色。
要求极其严格的身份匹配:相同发型、相同双马尾、相同的发色渐变、相同的发饰、相同的耳朵、完全相同的服装结构、相同的角色气质。面部结构必须严格遵循原角色的比例和特征——高度可辨认为该角色,而不是普通的漂亮脸蛋。
面部:非常吸引人但自然,动漫写实风格的美感,能看到毛孔并有轻微磨皮效果,淡淡的自然妆感,面颊和鼻子有轻微腮红,因吃火锅而皮肤略显油光和光泽,因温度产生轻微泛红,有些小瑕疵(轻微汗水、肤质不均),不会过度完美。
表情:她注意到相机,略微转头朝向镜头,有轻微反应并做出一个小而随意的动作(比如快速的胜利手势或淡淡的微笑),表情仍然自然,不做作,眼神短暂看向镜头但并非刻意摆拍,感觉像是瞬间的友好回应,而不是拍摄中的摆拍。
发型:因热气和动作稍微有些凌乱,几缕头发粘在脸颊或脖颈上,带有自然的运动模糊,坐着时略微塌陷。
服装:完全忠实于原始设计,真实面料有真实的褶皱,因坐着和用餐略有错位,细节有小幅移动。
姿势:身体略朝向镜头转动,一只手仍拿着筷子或放在桌上,另一只手随意做出小动作(胜利手/轻挥手),身体姿态放松自然,不是完整摆拍,仅是迅速反应。
场景(重要):海底捞火锅餐厅,角色扮演者坐在另一张桌子(隔桌或斜对面),靠近墙边或卡座,背景相对干净(墙板/镜面),她仍与自己的同伴一起用餐。
环境:靠墙的干净就餐区,柔和的墙面灯光,热气轻微冒起,桌上有肉盘、饮料、蘸料。
构图(非常重要):有种从你自己桌子拍摄的感觉,主体不居中,略微拉近、有些别扭的裁切,身体部分稍被截断。
前景(极其重要):你自己的桌子占据前景主位,火锅、汤、筷子、盘子清晰可见,桌沿挡住画面下方,你的手臂或肩膀部分遮挡视线,另一位食客轻微挡住画面,前景略微虚焦。
相机:构图欠佳,稍微倾斜,有轻微的动态模糊,焦点略偏,能看到颗粒感和 JPEG 压缩伪影(类似微信风格),镜头有污渍/油性模糊,手指微微遮住角落。
灯光:室内混合光源(暖黄光 + 柔和白光),曝光略不均匀,靠墙的灯光比大厅中心更柔和,皮肤和桌面有反光,热气使光线有扩散效果。
额外真实感:轻微的热气在主体前方流动,背景有细微的运动模糊,存在小规模遮挡(杯子/手臂/筷子挡住部分区域)。
氛围:你在正常用餐,同桌有一位高度
小红书可以直接上传 Skill 了,这个太屌了,感觉是个很大的事件。
@aigc1024
最近好像 Claude Code 连接飞书又火了
再推荐一下藏师傅两个多月前写的这个 Skills 哈。
它能连接 Telegram、飞书、QQ、微信、Discord 等各种 IM,支持 Claude Code 和 Codex
详情:github.com/op7418/Claude-to-IM-skill
@aigc1024
最近好像 Claude Code 连接飞书又火了
再推荐一下藏师傅两个多月前写的这个 Skills 哈。
它能连接 Telegram、飞书、QQ、微信、Discord 等各种 IM,支持 Claude Code 和 Codex
详情:github.com/op7418/Claude-to-IM-skill
@aigc1024
Anthropic的年化收入:
1月:90亿美金
2月:140亿美金
3月:190亿美金
4月:300亿美金
5月:450亿美金
人类历史上从来没有出现过的收入增长。
@aigc1024
刚刚结束的疯享交流,意犹未尽。AI 产品不只被讲出来,还真的被拿到现场展示、体验了。
有人带来灵巧手,有人带来3D空间扫描产品,还有数字分身上传、AI营销工具、体态筛查等产品在现场被分享。
今晚我们没聊空泛趋势,而是在做几件很具体的事:
💡先上手,再提问;
💡先体验,再反馈;
💡先看产品到底能不能用,再问它下一步该怎么改。
现场最有意思的部分,往往发生在体验之后。有人在台上讲产品,有人在台下认真试,Z世代AI创业者拿着“酒杯”合照,记录下今晚这场酣畅淋漓的相识。
北京站是一场真实互拆。深圳站则是一场直接上手的产品现场。
这就是 AI Next社区想做的事:让正在做AI产品的人,遇见彼此,彼此相助,共同成长。
如果你也正在做 AI 应用 / 硬件 / 垂直模型 / 具身智能,关注青腾公众号,留言你所在的城市。6月见。
@aigc1024
WaytoAGI联合红杉中国开启AGI House第一季:招募Builder入驻
@aigc1024
WaytoAGI联合红杉中国开启AGI House第一季:招募Builder入驻
@aigc1024
今天我们发布了 ColaOS,第一个有灵魂的 Agent OS。
这大概是我这辈子做过的最难做的一个产品了。
我们从 2024 年创业之初,就想做一个可以用自然语音交互的 Voice Agent,但是创业第一年真的好难,时代的发展也还未到,我们根本无法做出来,只能先把语音的部分先做完,也就是 ListenHub。
2025 年去年 9 月,我们拿到了第二轮融资,正式立项 Voice Agent,可依然困难重重。方向模糊,团队纠结,认知不到位,技术不支持...我们只能默默积累认知,积累技术。
直到今年 2 月,我觉得技术到位了,我的认知到位了,我找到团队,说出了全面回归初心 All In Agent 的想法, 我们迅速默契地达成了共识。
整个团队,心无旁骛,全速冲刺。
五周时间,我们终于,做出来了。
她叫 ColaOS。
来看个视频,认识一下她吧。
她背后的故事,都在这里
https://mp.weixin.qq.com/s/LypPv3wTqvW65HZHP6wvtg
@aigc1024
看晚点对豆包的报道,还是挺感慨的
豆包赢下了 AI chatbot 的胜利
只是这场胜利的价值几何,没有人能衡量
一些有趣的点:
朱骏在 2024 年 5 月的演讲中特意提到,豆包已经拥有 800 万个智能体。这次尝试没过多久便失败了。一段时间过后,团队发现除了 “豆包” 这个主智能体以外,其它智能体的用户活跃度都不高。
他们做了一次实验,将豆包以外的智能体全部下架,结果用户活跃、留存没有受到任何影响。
2024 年上半年,豆包的 “多 bot” 尝试受挫后,团队一度陷入迷茫,开始寻找新的突破口。他们曾考虑根据用户在豆包对中表达的兴趣进行主动的内容推荐,推荐内容包括抖音短视频,类似后来 ChatGPT 做的 Pulse,但最终决定不上线。
一位知情人士说,当时豆包对用户留存不满,所以想借抖音这款公司留存最好的产品来提高数据,“有些病急乱投医”。
抖音的单用户日均使用时长曾经从 30 分钟涨到 120 分钟,而豆包仍稳定在 10 分钟以内,尚不足以对传统的互联网产品造成威胁。
@aigc1024
AI 发展的里程碑时刻。
OpenAI 的一个未公布的内部推理模型,自主解决了 Erdős 1946 年提出的平面单位距离问。
chain of thought 长达125 页,核心手法是从代数数论拉了一套工具去解离散几何问,这个跨领域连接是人类 80 年没想到的。
最有意思的是这个模型不是专门为数学训练的,是通用推理模型。
这说明足够强的推理能力到了某个阈值之后,创造性会自然涌现。
恭喜人类。
https://openai.com/index/model-disproves-discrete-geometry-conjecture/
@aigc1024
有些问在今天的答案已经非常非常明显了
比如你做的事情壁垒在哪里,字节抄你怎么办这种问
就以非常实际的例子来说
Kimi 做了 coding 能力很强的模型,如果字节也做了,会怎样?
其实不会怎样啊,Kimi 该上市就上市,不会受到任何影响
而更早之前的 minimax 和 智谱都已经上市了
他们有什么是大厂做不了的东西吗?
manus arr 都要冲刺 10亿美金了
大厂抄一个完全一样的又怎样呢
这些问在增量世界里就是一种忆苦思甜
@aigc1024
看完了 Anker CEO 阳萌在晚点的访谈,一些有趣的片段:
1. 招不到最好的人不是人力总监的问,是做的事情不够难。大家一听做充电宝,最厉害的人肯定不会来。
2. 激进的保守主义者:10 块钱投 5 块,挣了 20 回来,有 25 块再投一半。盘子越来越大,但每次只投一半。
3. 不要盯着竞争,不要盯着过去,回到用户的极致需求。
4. 首先分配的是机会,根据价值观分配机会,根据结果分配回报。
5. 先推动几个团队做出来,然后大家就会跟上。中国人不一定羡慕别的公司,但一定羡慕同一拨进公司的人。
6. 一个事情做成需要不同的品质,出现在一个人身上非常珍贵,两个人各有一半就互补。阿里叫雌雄同体,华为叫狼狈同行。
7. 奔驰主打豪华,宝马主打驾驶乐趣,奥迪主打科技,竞争的终局是纳什均衡,不是你死我活。
8. 把公司当成产品,把"创造者的乐园"搭好,活很多年,我就是个非常好的产品经理。
9. 关注现在和未来,过去不好的经历都忘掉了。所以吵架必输。
10. 如果一个人最后做的事情不开心,这肯定不对。
https://mp.weixin.qq.com/s/5QKj6WJzY7L_U43pQ6j54g?scene=1
@aigc1024
Back to Top