基于深度学习的表观遗传时钟用于所有组织中的 DNA 甲基化
然后,我们旨在确定模型类型(即线性回归或神经网络)是否会对性能产生重大影响。 我们使用相同的特征将上述线性模型与神经网络 AltumAge 进行了比较。 AltumAge 的性能优于使用 Horvath 的 CpG 站点(353 对 3,011,MSE:32.732 对 46.667)和 ElasticNet 的 903 CpG 站点(MAE:2.302 对 2.621,MSE:30.455 对 30.9198)的线性模型。 这表明在使用相同的数据和特征时,AltumAge 优于线性模型。
随着功能集从 Horvath 的 353 个站点(MAE = 2.425,MSE = 32.732)扩展到 903 个 ElasticNet 选择的 CpG 站点(MAE = 2.302,MSE 30.455),最终扩展到所有 20,318 个 CpG 站点,AltumAge 的性能得到提高。 随着功能集从 Horvath 353 CpG(MAE 2.425,MSE 32.732)扩展到 903 个 ElasticNet 选择的 CpG(MAE 2.302 MSE 30.455)到所有 20,318 个站点(MAE 2.153 MSE 29.486),AltumAge 的性能得到改善。 这表明扩展的功能集提高了性能。 这可能是因为 ElasticNet 的 CpG 站点选择没有捕获所有相关的表观遗传信息。
这些结果表明,AltumAge 比 ElasticNet 更有效,即使预测误差随着数据样本的增加而降低。 与 ElaticNet 相比,AltumAge 的较低误差不受其他数据拆分的影响。 (Alpaydin 的组合 5-x-2cv F 检验 p 值:9.71e-5)。
来源和详细信息:
https://www.nature.com/articles/s41514-022-00085-y