通过多功能模块化人工智能模型打破障碍

新的模块化人工智能模型:任意进出

洛桑联邦理工学院的研究人员开发了一种独特的模块化机器学习模型,用于灵活决策。 它可以输入任何类型的文本、图像、声音或视频并输出任意数量的预测。

LLM,也称为大型语言模型(或 LLM),是使用大量文本进行训练的深度学习模型。 它们是 OpenAI 的新 ChatGPT 等聊天机器人的基础。 多模态模型可以通过文本以外的其他输入进行训练。 其中包括视频、音频和图像。

创建较小规模的 MM 会带来许多挑战。 其中之一是需要在面对非随机丢失信息时保持稳健。 模型可能没有此信息,这通常是资源可用性有偏差的结果。 因此,确保模型在进行预测时不会学习偏差缺失模式非常重要。

来源和详细信息:
https://techxplore.com/news/2024-02-modular-ai.html