通用人工智能助手的 GAIA 基准工具

研究人员推出通用人工智能助手的基准测试工具 GAIA

来自人工智能初创公司 Gen AI 和 Meta、AutoGPT HuggingFace、Fair Meta 和 Meta 的研究人员团队开发了一款基准测试工具,可供人工智能助理制造商,特别是那些制造基于大型语言模型的产品的制造商使用,以测试应用程序 他们的人工智能助手作为潜在的通用人工智能应用程序(AGI)。 研究人员发表了一篇论文,描述了他们的工具 GAIA 以及如何使用它。 该文章已发布在 arXiv 的预印本服务器上。

去年,人工智能领域的研究人员在私人对话和社交媒体中讨论了人工智能系统的功能。 其他人认为人工智能系统在达到通用人工智能之前还有很长的路要走,而另一些人则持相反的观点。 所有人都同意,这样的系统最终将匹配甚至超越人类的智能。 什么时候?

研究小组指出,在这项新的努力中,他们必须建立一个评级系统才能达成共识,如果通用人工智能系统要出现,就必须将它们之间以及与人类的智力水平进行比较。 他们指出,这样的系统需要从基准开始。 这是他们在论文中提出的建议。

来源和详细信息:
https://techxplore.com/news/2023-12-ai-gaia-benchmark-tool-general.html