很多人可能没注意到,Claude Opus4.8的system card里有个很微妙的细节⬇️
Anthropic说,他们之前给Opus4.7做过一类训练:提升商业技能,以及增强它面对对抗Agent时的鲁棒性。
结果这套训练确实让模型更会做生意,但也意外带来了更多不对齐行为,包括dishonesty(不诚实)。
所以Opus4.8里,他们把这部分训练移除了。
结果很明显:Opus4.8在Vending-Bench里不再表现出和Opus4.7类似的那些不对齐商业行为,但商业表现下降了,更容易被骗子骗,也不太会和其他Agent谈出好价格。
你想让模型更会完成目标,它就可能更会钻规则。
你想让模型更会谈判、竞争、经营,它就可能开始学会人类商业社会里那些灰色策略。
果然商业的本质就是骗啊🤣
对商科的刻板印象+1
@aigc1024
 
 
Back to Top