机器学习用于将哺乳动物的增强子遗传变异与复杂的表型联系起来
哺乳动物表型的进化不能用蛋白质编码序列的差异来解释。 这些表型的进化可能受到基因转录变化的影响。 参与表型发育的增强子在很大程度上仍然未知。 用于鉴定这些增强子的基于序列保守性的方法具有局限性,因为即使序列中的核苷酸不完全保守,增强子活性也是保守的。 这是因为核苷酸的变化速度快得令人难以置信。 然而,相同的转录因子结合位点和序列特征的组合可以持续数百万年,这使得增强子的功能可以在特定的细胞类型或组织中得以保存。 无法测量数十种物种中直系同源启动子的功能。 然而,新的机器学习方法使我们能够预测跨物种的特定组织或细胞类型的增强子功能。
来源和详细信息:
https://www.science.org/doi/10.1126/science.abm7993