新技巧利用AI来越狱AI模型,包括GPT-4

对抗性算法能够系统地测试大型语言模型,例如 OpenAI 的 GPT-4,以找出可能导致其行为不当的弱点。

来源和详细信息:
https://www.wired.com/story/automated-ai-attack-gpt-4/

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注