DeepMind Ada 引入了强化学习的基础模型
DeepMind 的 AdA 证明基础模型也可用于启用通才强化学习系统并快速学习新任务。

一些科学家使用术语“基础模型”来描述经过预训练的大型 AI 模型,并且通常基于 transformer 架构。 OpenAI 的 GPT-3 大型语言模型就是一个例子。 它经过训练可以预测文本标记,然后可以使用提示工程执行各种任务。

简而言之,基础模型是一个大型 AI,由于它在大型数据集上进行了通才训练,因此可以在以后执行许多没有经过专门训练的任务。

来源和详细信息:
https://the-decoder.com/deepmind-ada-brings-foundation-models-to-reinforcement-learning/?no_cache=1675544086

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注