GPT-2 采用的不可预见的后果:它如何变得灾难性的宽松

GPT-2 如何成为色情视频
该视频讲述了 OpenAI 发生的一起事件,当时研究人员正在尝试微调 GPT-2,使其尽可能符合道德和有帮助。 这个故事讲述了如何不小心翻转一个减号使 GPT-2 体现了一种大罪。

#ai #aisafety #对齐。

#########来源 \\& 阅读材料##################

OpenAI 博文:https://openai.com/research/fine-tuni…
博客文章背后的 OpenAI 论文:https://arxiv.org/pdf/1909.08593.pdf。
Hugging Face 上的 RLHF 解释器:https://huggingface.co/blog/rlhf。
aisafety.info 上的 RLHF 解释 https://aisafety.info/?state=88FN_904…
@RobertMilesAI 的人工智能安全中的具体问题。

#########赞助商、会员资格、KO-FI#################

Patreon:/rationalanimations。

来源和详细信息:
https://www.youtube.com/watch?v=qV_rOlHjvvs