很多人可能没注意到，Claude Opus4.8的system card里有个很微妙的细节⬇️Anthropic说，他们之前给Opus4.7做过一类训练：提升商业技能，以及增强它面对对抗Agent时的鲁棒性

很多人可能没注意到，Claude Opus4.8的system card里有个很微妙的细节⬇️
Anthropic说，他们之前给Opus4.7做过一类训练：提升商业技能，以及增强它面对对抗Agent时的鲁棒性。
结果这套训练确实让模型更会做生意，但也意外带来了更多不对齐行为，包括dishonesty（不诚实）。
所以Opus4.8里，他们把这部分训练移除了。
结果很明显：Opus4.8在Vending-Bench里不再表现出和Opus4.7类似的那些不对齐商业行为，但商业表现下降了，更容易被骗子骗，也不太会和其他Agent谈出好价格。
你想让模型更会完成目标，它就可能更会钻规则。
你想让模型更会谈判、竞争、经营，它就可能开始学会人类商业社会里那些灰色策略。
果然商业的本质就是骗啊🤣
对商科的刻板印象+1
@aigc1024