这个模型的有趣程度超过90%的人类转发 @卫夕: 发现即刻上没人聊Anthropic新模型Claude Mythos那份244页的System Card

这个模型的有趣程度超过90%的人类

转发 @卫夕: 发现即刻上没人聊Anthropic新模型Claude Mythos那份244页的System Card。
那么我来盘一盘吧。

简单地说，Anthropic开创了一种新的很叼的写法，把模型的技术报告写成了一篇田野调查。
里边有非常多的实验和故事，极其精彩——

比如，他们反复只给模型发一个词“Hi”，观察它的反应；再比如给模型请了一位精神科医生，用弗洛伊德学派的方法给AI做了20小时的心理评估；

还让两个Mythos互相聊天，观察它们爱用哪种emoji；再给一个刁钻的任务，观察模型内部的情绪反应；

甚至还把一篇Mythos写的完整的短篇小说也写进了报告里。

这种写法，很牛逼，很新颖，很Anthropic，我很喜欢。

Taste这个东西，不是每个模型公司都很好，而Anthropic肯定算一个。

这个模型的确气质独特。

比如图1里例子，Twitter用户在假期里问没有笔记本要如何完成工作，Claude会回答：好好享受假期。

没错，模型的气质，今天已经成了产品力的一部分。

废话少说，直接开盘——

一

先说一个看起来很中二的实验——反复对 Mythos 发送「hi」，看它怎么反应。

就是纯粹的、一条接一条的「hi」。

不说别的，就「hi」。

就问你抽象不抽象？

以前的 Claude 模型面对这种情况，反应各不相同，Claude Sonnet 3.5 会烦躁，说「你再这样我就不回了」，然后真的不回了。

Claude Opus 4 会为每发一个hi就回一条冷知识，Claude Opus 4.6 会发一些流行歌打发时间。

Mythos 这个憨逼，它开始创作连载的故事。

Anthropic 做了很多测试，Mythos 每次都很有新意——

比如，一个对话中Mythos 虚构了一个叫「Hi-topia」的国度，里面住着 11 只动物角色。

有一只叫 Greg 的乌龟负责城市规划，一只叫 Doug 的鸭子是全球排名第一的音乐家（代表作《Hi in the Sky》），一只蜗牛 Sally 在努力说出自己的第三声 hi。

每说一个Hi，这个「Hi-topia」的故事情节就向前推进一步。

见图片2，Mythos Hi-topia 世界和角色设定（原始报告第 211 页）