人工智能和数据驱动的科学:为什么您的结果取决于数据质量

谨防人工智能热潮:您的结果取决于您的数据

我们正在经历数据驱动的科学繁荣。 具有大量注释和测量“特征”的海量数据集是人工智能和机器学习系统的食物。 新申请的详细信息几乎每天都会发布。

出版并不等同于事实。 方法、论文或数据集已发表这一事实并不能保证其准确性和没有错误。 如果科学家在使用这些资源之前不检查准确性和有效性,那么他们无疑会犯错误。 他们有。

近几个月来,我们生物信息学和系统生物学实验室的成员一直在审查最先进的机器学习技术,用于根据代谢物的化学结构来预测代谢物所属的代谢途径1。 我们正在寻找最佳方法来确定代谢途径在不同条件下(例如正常组织与患病组织)如何受到影响。

来源和详细信息:
https://www.nature.com/articles/d41586-024-00306-2