使用 DeepMind Ada 探索基础模型在强化学习中的潜力 – 谷歌AI优化指南

DeepMind Ada 引入了强化学习的基础模型
DeepMind 的 AdA 证明基础模型也可用于启用通才强化学习系统并快速学习新任务。

一些科学家使用术语“基础模型”来描述经过预训练的大型 AI 模型，并且通常基于 transformer 架构。 OpenAI 的 GPT-3 大型语言模型就是一个例子。它经过训练可以预测文本标记，然后可以使用提示工程执行各种任务。

简而言之，基础模型是一个大型 AI，由于它在大型数据集上进行了通才训练，因此可以在以后执行许多没有经过专门训练的任务。

来源和详细信息：
https://the-decoder.com/deepmind-ada-brings-foundation-models-to-reinforcement-learning/?no_cache=1675544086

发表回复取消回复