Anthropic推出“Claude宪法”确保AI道德性（2 / 2）

的语言在 Anthropic上适得其反。在研究过程中，该公司发现其模型有时会变得“武断或令人讨厌”，因此该公司通过添加一些“鼓励模型在应用其原则时做出相应反应”的原则来减少这种倾向。　　Anthropic承认，由于世界上价值观的多元性，不同的文化可能需要不同的规则处理方法。他表示，AI模型将具有“价值系统”，无论是有意还是无意。它希望通过宪法 AI，不同文化可以轻松地看到人工智能语言模型中的“道德”规则，并根据需要进行调整。　　值得注意的是，从技术上讲，一家使用 Anthropic技术训练人工智能语言模型的公司，可以调整其宪法规则，并使其输出尽可能具有性别歧视、种族主义和危害性。然而，针对这一可能性，该公司在公告中没有讨论。　　“从我们的角度来看，我们的长期目标不是试图让我们的系统代表一种特定的意识形态，”它说，“而是能够遵循一套特定的原则。我们预计随着时间的推移，将有更大的社会进程被开发出来，用于创建人工智能宪法。”