Meta AI 团队开源 Mephisto:一个用于收集数据以训练 ML 模型的开放和协作方式的新平台
拥有用于训练新 AI 模型的各种数据集非常重要。 许多常用的数据集都被标签错误所污染。 很难为新任务开发稳健的模型,尤其是在存在标签错误的情况下。 为了克服这些限制,许多研究人员采用各种数据质量控制程序等技术。 这些策略没有中央存储库。
Meta AI 的研究人员发布了 Mephisto。 它是一个平台,可让您收集、共享和迭代收集数据集以训练 AI 模型的最佳方法。 研究人员可以以可重用和可迭代的格式与 Mephisto 共享独特的收集策略。 他们还可以快速更改组件并找到注释,从而减少创建自定义任务的障碍。
该团队确定了在 Mephisto 中推动从概念到数据捕获的复杂注释活动的通用路径。 Mephisto 不仅提高了数据集的质量,还提高了研究人员和创建它们的注释的经验。
来源和详细信息:
https://www.marktechpost.com/2022/03/30/meta-ai-team-open-sources-mephisto-a-new-platform-for-open-and-collaborative-way-of-collecting-data-to-train-ml-models/