正如一篇论文所揭示的,OpenAI 的 GPT-4 愿景仍存在一些缺陷
OpenAI 的旗舰人工智能文本生成模型 GPT-4 于 2013 年首次推出。该公司称赞该模型的多模态性,即理解文本和图像的能力。 OpenAI 声称 GPT-4 能够为复杂图像添加字幕和解释。 例如,它可以在 iPhone 插入 Lightning 线缆的照片中识别出 Lightning 线缆适配器。
不过,OpenAI 自 3 月底发布以来,一直没有发布 GPT-4 的图像特征。 据报道,这是出于对隐私和滥用行为的担忧。 直到最近,人们才知道这些恐惧的确切性质。 OpenAI 发表了一篇文章,详细介绍了他们的工作,以缓解 GPT-4 图像分析软件的一些问题较多的功能。
OpenAI 在内部缩写为 GPT-4V,以表明它仅被少数用户使用。 Be My Eyes 是一款旨在帮助盲人和弱视人士驾驭周围环境的应用程序。 报告称,OpenAI 在过去几个月开始与“红队”合作,测试模型并寻找意外行为。
来源和详细信息:
https://techcrunch.com/2023/09/26/openais-gpt-4-with-vision-still-has-flaws-paper-reveals/