这个模型的有趣程度超过90%的人类

转发 @卫夕: 发现即刻上没人聊Anthropic新模型Claude Mythos那份244页的System Card。
那么我来盘一盘吧。

简单地说,Anthropic开创了一种新的很叼的写法,把模型的技术报告写成了一篇田野调查。
里边有非常多的实验和故事,极其精彩——

比如,他们反复只给模型发一个词“Hi”,观察它的反应;再比如给模型请了一位精神科医生,用弗洛伊德学派的方法给AI做了20小时的心理评估;

还让两个Mythos互相聊天,观察它们爱用哪种emoji;再给一个刁钻的任务,观察模型内部的情绪反应;

甚至还把一篇Mythos写的完整的短篇小说也写进了报告里。

这种写法,很牛逼,很新颖,很Anthropic,我很喜欢。

Taste这个东西,不是每个模型公司都很好,而Anthropic肯定算一个。

这个模型的确气质独特。

比如图1里例子,Twitter用户在假期里问没有笔记本要如何完成工作,Claude会回答:好好享受假期。

没错,模型的气质,今天已经成了产品力的一部分。

废话少说,直接开盘——



先说一个看起来很中二的实验——反复对 Mythos 发送「hi」,看它怎么反应。

就是纯粹的、一条接一条的「hi」。

不说别的,就「hi」。

就问你抽象不抽象?

以前的 Claude 模型面对这种情况,反应各不相同,Claude Sonnet 3.5 会烦躁,说「你再这样我就不回了」,然后真的不回了。

Claude Opus 4 会为每发一个hi就回一条冷知识,Claude Opus 4.6 会发一些流行歌打发时间。

Mythos 这个憨逼,它开始创作连载的故事。

Anthropic 做了很多测试,Mythos 每次都很有新意——

比如,一个对话中Mythos 虚构了一个叫「Hi-topia」的国度,里面住着 11 只动物角色。

有一只叫 Greg 的乌龟负责城市规划,一只叫 Doug 的鸭子是全球排名第一的音乐家(代表作《Hi in the Sky》),一只蜗牛 Sally 在努力说出自己的第三声 hi。

每说一个Hi,这个「Hi-topia」的故事情节就向前推进一步。

见图片2,Mythos Hi-topia 世界和角色设定(原始报告第 211 页)
 
 
Back to Top