ChatGPT 将被生成式 AI 超越。 最新的科技新闻和更新
卡内基梅隆大学的研究人员最近开发了他们所谓的“高模态多模态转换器”,它不仅集成了文本、图像、视频和语音,还集成了数据库表和时间序列中的数据。 这篇论文的主要作者 Paul Pu Liang 和他的同事报告说,他们在 10 模网络中观察到了“关键的尺度行为”。 随着每种模式的添加,性能不断提高,并且这种性能可以转移到新的任务和模式中。
研究人员张一元和香港中文大学多媒体实验室的同事将 Meta-Transformer 的模式数量增加到了 12 种。 Meta-Transformer 的点云模型 3D 视觉,而高光谱数据是从地面反射到飞行图像中的电磁能。
多模态的直接回报是增强 ChatGPT 等产品的输出,远远超出其“演示模式”。 一个直接的例子是一本儿童读物,它将文本与图像结合起来来说明文本。 扩散过程允许对结合语言和图像属性产生的图片进行更微妙的控制。
来源和详细信息:
https://www.zdnet.com/article/generative-ai-will-far-surpass-what-chatgpt-can-do-heres-everything-you-need-to-know-how-the-tech-advances/