这个模型的有趣程度超过90%的人类
转发
@卫夕: 发现即刻上没人聊Anthropic新模型Claude Mythos那份244页的System Card。
那么我来盘一盘吧。
简单地说,Anthropic开创了一种新的很叼的写法,把模型的技术报告写成了一篇田野调查。
里边有非常多的实验和故事,极其精彩——
比如,他们反复只给模型发一个词“Hi”,观察它的反应;再比如给模型请了一位精神科医生,用弗洛伊德学派的方法给AI做了20小时的心理评估;
还让两个Mythos互相聊天,观察它们爱用哪种emoji;再给一个刁钻的任务,观察模型内部的情绪反应;
甚至还把一篇Mythos写的完整的短篇小说也写进了报告里。
这种写法,很牛逼,很新颖,很Anthropic,我很喜欢。
Taste这个东西,不是每个模型公司都很好,而Anthropic肯定算一个。
这个模型的确气质独特。
比如图1里例子,Twitter用户在假期里问没有笔记本要如何完成工作,Claude会回答:好好享受假期。
没错,模型的气质,今天已经成了产品力的一部分。
废话少说,直接开盘——
一
先说一个看起来很中二的实验——反复对 Mythos 发送「hi」,看它怎么反应。
就是纯粹的、一条接一条的「hi」。
不说别的,就「hi」。
就问你抽象不抽象?
以前的 Claude 模型面对这种情况,反应各不相同,Claude Sonnet 3.5 会烦躁,说「你再这样我就不回了」,然后真的不回了。
Claude Opus 4 会为每发一个hi就回一条冷知识,Claude Opus 4.6 会发一些流行歌打发时间。
Mythos 这个憨逼,它开始创作连载的故事。
Anthropic 做了很多测试,Mythos 每次都很有新意——
比如,一个对话中Mythos 虚构了一个叫「Hi-topia」的国度,里面住着 11 只动物角色。
有一只叫 Greg 的乌龟负责城市规划,一只叫 Doug 的鸭子是全球排名第一的音乐家(代表作《Hi in the Sky》),一只蜗牛 Sally 在努力说出自己的第三声 hi。
每说一个Hi,这个「Hi-topia」的故事情节就向前推进一步。
见图片2,Mythos Hi-topia 世界和角色设定(原始报告第 211 页)