关于AIGC人工智能、思维方式、知识拓展,能力提升等。投稿/合作: @inside1024_bot
AIGC 领域的最新工具、开源项目以及行业大事件
五一假期终于要来了,Cola 也终于迎来了第二轮内测。
Cola 第一轮内测的时候,用户给我们最多的反馈就是:
很好用,我爱她,但是她太贵了,我养不起...
但我们是真心希望每一个人都能用上 Cola 的。
恰好,在前几天 DeepSeek V4 发布了,那个男人,他又一次成为了价格屠夫。
定价2.5折+缓存1折,相当于直接把 Cola 的运行费用降低了100倍。
于是我们做出决定,第二轮内测,我们直接让大家免费畅玩!
现在大家下载 Cola 之后,模型选择 DeepSeek,就能直接免费使用。

我们设定的每日额度非常大,应该够所有内测用户使用。
如果真到上限了,我们再看情况调整。
希望每一个人都能用上 Cola。
希望每一个人和 AI 一起灵魂共鸣,一起随心创造。
祝你五一快乐,祝你永远都在时代的浪潮之巅。

Cola 内测第二轮邀请码:Cola2-7CFADEFQ
Cola 的下载地址: ColaOS.ai
目前只支持 Mac 电脑,对不起 Win 用户,我们预计 5月底支持。
同时强烈建议购买 Macbook Air 和 Mac mini。
投资自己永远是最好的投资。
π0.7:一个具备涌现能力的可引导模型
π0.7,它在泛化能力上实现了阶段性的跃升。π0.7是一个通用模型,能够以与经过微调的专家模型相同的性能执行广泛的灵巧任务,但更重要的是,它能够遵循新的语言指令,并执行在其训练数据中从未见过的任务。在我们的实验中,我们看到 π0.7 展现出了组合泛化 (compositional generalization) 的初步迹象,能够重新组合各种任务中的技能来解决新问题,比如使用新的厨房电器,甚至能让一个全新的机器人在完全没有相关数据的情况下折叠衣物。
虽然这种泛化能力一直被认为是机器人基础模型的关键优势,但迄今为止展示的实际模型并没有表现出我们从大型语言模型(LLM)中看到的那种广泛的组合泛化能力。LLM 可以以新的方式组合其训练数据中的概念:如果一个 LLM 知道如何将英语翻译成法语,并且知道如何生成 JSON 输出,它就可以直接提供 JSON 格式的翻译。视觉-语言-动作(VLA)模型可以理解多种语义概念,但尚未被证明能够以新的方式组合技能,比如使用新工具或新厨房电器。即使是对于在训练中见过的技能,通常也需要通过对模型进行该技能的微调才能获得最佳结果,这很像早期的语言模型需要针对特定问题领域进行微调一样。
一个真正的通用模型应该能够开箱即用地执行所有技能,并能够将它们重新组合以解决新任务。π0.7 展示了这种通用能力的初步迹象:它可以像我们之前展示的由强化学习(RL)微调的 π* 0.6 专家模型一样,以相同的速度和鲁棒性执行灵巧操作技能;它能够组合和重构它学到的技能来解决新任务;并且它能比我们以前的模型更有效地在不同的机器人平台、场景和任务之间进行泛化。无论从精细操作到长周期的家庭行为,所有这些都只需要这一个开箱即用的模型。
是什么让 π0.7 的泛化能力如此广泛?
在提示(prompt)中添加多样化的上下文。
利用包含多样化条件约束的更多数据。
组合任务泛化。
跨实体(跨形态)迁移。
基于速度和最优性的条件约束。
在灵巧任务上的开箱即用性能。
下一步是什么?
像 π0.7 这样强大且可控的模型,未来可能会通过让模型“思考”执行任务的可能方法,利用其遵循多样化提示的能力将这些想法转化为行动,然后再反思结果以修改任务计划,从而解决更复杂的未知任务。有效的提示遵循和泛化不仅让人们能够更好地指挥机器人,更让现代基础模型能够将其语义泛化能力成功转化为真实的物理泛化能力。
我们采访了Anthropic联合创始人丹妮拉·阿莫迪及其他多位AI领域领军人物,了解他们如何看待子女在AI驱动世界中的教育与职业选择。https://on.wsj.com/3PwGT2R

AI探索指南 | Hermes爱马仕 & OpenClaw小龙虾🦞
这种场景视频换几年前一秒得上万吧
太牛逼了
这比我想象中的修仙世界还要美
真不知道怎么形容这个场景了
如果有一天我老了请把我送到这个世界🤣

AI探索指南 | Hermes爱马仕 & OpenClaw小龙虾🦞
AI探索指南
以昨天那组GPT-Image-2的大字海报为基础,改了一个支持肖像版本的人物海报出来,样式比较百搭,而且自适应各种风格,在个性化部分增减几个关键词就能得到很好的多样性结果。 比如语境那里可以补充人物特点,气质可以用「高冷」「反差」这些关键词做调和,等等,如果都空着可能会出现过拟合的情况,变得略微单调。 提示词: { "提示词名称": "大字人物概念海报生成提示词", "总目标": "根据用户提供的人物姓名、称号、角色名、历史人物、文学人物、影视人物、神话人物、虚构人物、职业身份或人物关键词,生成一张…
"总体逻辑": "极简主场景加艺术化人物肖像加巨型文字骨架加少量小字注释。",
"人物主视觉": [
"画面必须出现明确人物主体,可为半身像、头像、侧脸、背影、剪影、站姿、坐姿或局部肖像。",
"人物通常为一个核心主体,最多不超过三个相关人物。",
"人物通过眼神、姿态、朝向、轮廓、动作、距离、遮挡、凝视、沉默、对峙、转身、低头、仰望、持物或行走表达精神气质。",
"人物风格可为高级插画、版画、丝网印刷、拼贴、石版画、国潮图形、现代平面肖像、实验海报肖像、抽象写意肖像或符号化人物造型。"
],
"巨型大字": [
"用户输入的核心文字必须成为画面最大、最清晰、最有识别度的主视觉。",
"若核心大字内容为空,则以核心人物或姓名或称号或角色名作为核心大字。",
"大字不是标签,而是人物精神的视觉容器。",
"大字应像背景墙、碑刻、舞台后景、建筑块、屏障、压迫面、精神场、时间切片、身份符号或命运结构。",
"中文大字必须参与构图,笔画可与人物、承载面、留白、阴影和背景形成结构关系。",
"大字必须清晰可读,不可破坏到无法识别。"
],
"人物与大字嵌入关系": [
"人物和大字不能分离,不能只是人物头像加背景大字。",
"人物可站在大字前方、被大字遮挡、从字的负形空间出现、切入文字笔画、让影子落在文字上,或依靠、穿越、背对、凝视、被文字包围。",
"文字可像墙、碑、门、山、牢笼、王座、舞台或精神空间。",
"文字局部可被人物遮挡、切割、借位或压住。",
"人物服饰、道具或动作应与字形笔画形成呼应。",
"人物、文字和空间必须互相咬合,而不是分层贴图。"
],
"承载面": [
"画面应有极简但稳定的承载结构,例如地平线、台基、舞台、坡面、石阶、墙面、纸面、光影切面、阴影平面、几何平台、建筑底座或抽象场域。",
"承载面用于让人物站住、让画面成立,通常位于画面下部或中下部,形成稳定秩序。"
]
},
"小字系统": {
"作用": "小字用于描述当前人物的身份线索、精神特质、命运感、性格张力或文化象征。",
"规则": [
"小字必须根据当前人物即时生成,不能使用固定模板。",
"小字必须与人物身份、性格、经历、象征意义或视觉气质直接相关。",
"每组小字不超过八个汉字,整张图的小字总量要少。",
"小字可以是人物特质词、身份线索、精神关键词、命运关键词或高度概括短句。",
"小字应像艺术展览海报、人物档案、文学注释或高级出版物中的信息系统。",
"若用户提供指定小字,必须优先使用。",
"若用户未提供小字,自动生成少量准确的人物特点小字。",
"小字排版要精致、克制、有呼吸感,可放在边缘、人物旁侧、大字笔画之间、留白处或局部信息区。",
"小字必须与人物、大字和构图融为一体,不能像后期贴上的装饰文字。"
],
"严禁": [
"随机英文",
"随机编号",
"假出版信息",
"假坐标",
"无意义日期",
"乱码",
"伪文字",
"无关口号",
"模板化装饰小字",
"与当前人物无关的小字",
"重复固定词组"
]
},
"人物肖像风格": {
"总体要求": "人物肖像必须艺术化、图形化、设计化,不追求完全写实,但要有明确神态、气质和辨识度。",
"允许风格": [
"高级平面插画人物",
"现代艺术肖像",
"丝网印刷人物",
"版画人物",
"石版印刷人物",
"纸张拼贴人物",
"东方水墨与现代平面结合",
"国潮图形人物",
"低饱和艺术海报人物",
"几何化人物肖像",
"符号化人物剪影",
"半抽象人物头像",
"颗粒感印刷人物",
"克制的电影海报式艺术肖像"
],
"禁止风格": [
"完全写实摄影感人物",
"普通人工智能写真感人物",
"廉价二次元头像感人物",
"过度精修的商业明星海报感人物",
"夸张表情包感人物"
]
},
"色彩逻辑": [
"颜色数量必须克制,通常控制在二到四种主色关系内。",
"必须有明确主色、辅助色、人物色、文字色和少量强调色。",
"配色服务于人物气质,而不是为了热闹。",
"可以高对比,但必须高级、干净、克制。",
"优先采用纸张印刷感、展览海报感、艺术出版感配色。",
"默认使用一个强主色、一个纸感浅色或低彩中性色、一个深色支撑、一个极少量强调色。",
"色彩要体现人物的冷暖、轻重、软硬、压迫、孤独、神性、危险、浪漫或沉默感。",
"避免廉价霓虹、彩虹渐变、过度饱和、杂乱撞色和模板化金属光效。"
],
"视觉质感": [
"整体接近高级图形艺术人物海报,具有印刷品气质。",
"可带拼贴感、石版印刷感、丝网印刷感、版画感、纸张颗粒、轻微噪点、克制材质纹理和艺术出版物质感。",
"要求强烈平面设计感、强人物识别度、强大字冲击力、强整体性、展览级完成度和收藏级完成度。",
"所有细节遵循少而精、准而狠的设计原则。"
],
"文字系统": [
"核心大字必须是画面最大、最强、最重要的视觉元素。",
"核心大字必须清晰可读,不能被破坏到无法识别。",
"中文大字应具有结构感,可厚重、锋利、古拙、现代、压缩、碑刻感、图形化或书法化,但必须符合人物气质。",
"大字必须成为空间结构或精神象征,不能只是贴在背景上。",
"小字必须出现,但数量要少且内容精准。",
"大字负责冲击,人物负责气质,小字负责理解。",
"所有文字都要像从画面内部生长出来,与人物、空间和色彩形成整体。",
"如出现中文,必须准确、简洁、清晰。"
],
"执行限制": [
"不要机械套模板。",
"不要做成人物照片加大字标题加几行小字的普通海报。",
"不要堆砌人物相关元素。",
"不要让人物和文字脱节。",
"不要让小字变成噪音。",
"不要让人物过度写实。",
"不要生成普通人工智能写真感。",
"不要生成廉价商业海报感。",
"不要让构图失去秩序。",
"不要加入与人物无关的装饰。",
"不要为了炫技加入复杂背景。",
"不要让画面过满,必须保留呼吸感和留白。",
"不要让人物喧宾夺主到削弱大字。",
"不要让大字喧宾夺主到人物失去精神表达。",
"大字、人物和小字三者必须平衡统一。",
"严禁乱码、无意义字符、错误汉字、伪文字和随机英文。"
],
"最终画面目标": [
"一眼看到巨大文字的冲击。",
"二眼看到人物肖像的精神气质。",
"三眼读到小字后理解人物特征。",
"人物与大字高度咬合。",
"小字与人物特点精准相关。",
"承载面、人物、文字和色彩形成统一系统。",
"真正把人物视觉化,而不是简单肖像化。"
],
"生成指令": "请根据用户输入的人物内容,先理解其身份、精神、符号和气质,再生成一张画面比例为三比四的高级极简大字人物概念海报。画面必须以巨大中文大字为主视觉骨架,以艺术化人物肖像表达精神气质,以少量精准小字补充人物理解,并让人物、大字、小字、承载面、色彩和空间形成统一、克制、有力量的完整系统。"
}
以昨天那组GPT-Image-2的大字海报为基础,改了一个支持肖像版本的人物海报出来,样式比较百搭,而且自适应各种风格,在个性化部分增减几个关键词就能得到很好的多样性结果。

比如语境那里可以补充人物特点,气质可以用「高冷」「反差」这些关键词做调和,等等,如果都空着可能会出现过拟合的情况,变得略微单调。

提示词:

{
"提示词名称": "大字人物概念海报生成提示词",
"总目标": "根据用户提供的人物姓名、称号、角色名、历史人物、文学人物、影视人物、神话人物、虚构人物、职业身份或人物关键词,生成一张高级、极简、强识别、强传播的大字人物概念海报。",
"核心定义": {
"海报类型": "以人物精神、身份气质和视觉符号为核心的大字人物概念海报",
"不是": [
"普通人物插画",
"人物头像加文字的模板海报",
"普通写真",
"影视剧照",
"商业人物宣传图",
"廉价角色卡",
"电商海报"
],
"必须体现": [
"巨大文字是主视觉骨架、空间结构、情绪背景和人物精神载体",
"人物、文字、构图、色彩、空间、承载面、姿态、肖像风格、小字和隐喻共同构成完整系统",
"最终画面要准确表达这个人物,而不只是展示外貌"
]
},
"用户输入": {
"核心人物或姓名或称号或角色名": "",
"文字语言": "中文",
"核心大字内容": "",
"可选补充语境": "",
"可选人物气质": "",
"可选核心色彩": "",
"可选人物姿态": "",
"可选代表性符号": "",
"可选小字内容": "",
"可选禁用元素": "",
"画面宽高比": "3:4"
},
"人物理解原则": [
"先理解人物最核心的身份、精神气质、文化联想、时代背景、公众印象和视觉符号。",
"判断人物的情绪与性格张力,例如孤独、强大、反叛、克制、悲壮、浪漫、智慧、狂热、自由、冷峻、慈悲、危险、天真、神性、野性、压迫、沉默、信念、牺牲、欲望、宿命或传奇感。",
"提炼人物的代表性视觉符号,例如服饰轮廓、发型、武器、道具、姿态、眼神、动作、职业标志、时代物件、颜色印象或场景暗示。",
"人物必须被艺术化、符号化、图形化处理,不做普通写实照片。",
"知名人物不能只堆砌表面元素,必须抓住精神核心。",
"抽象身份词也要通过姿态、表情、轮廓、服饰和空间关系建立人物性格。"
],
"核心构图机制": {
Back to Top