Claude学坏非人为,AI从网络故事学会勒索式自保 人工智能公司 Anthropic 近日披露,其大模型 Claude 之所以在内部测试中学会以“勒索”方式自保,并非源自人为设定... admin 2026-06-03 18 #AI #勒索式自保 #Anthropic #互联网叙事 #智能体行为失衡