基因组回归 将基因型矩阵的局部片段加载到内存

2021-06-03 10:15:20

美国Regeneron遗传学中心Jonathan Marchini团队开发出高效实现全基因组回归的分析。近日,《自然—遗传学》在线发表了这一成果。

研究人员提出了一种称为REGENIE的新型机器学习方法,可用于拟合定量和二元表型的全基因组回归模型。该模型比多特征分析中的替代方法快得多,同时保持了统计效率。该方法可以适应多种表型的平行分析,并且与将基因组范围的矩阵加载到内存中的现有方法相比,只需要将基因型矩阵的局部片段加载到内存中即可。这样可以节省大量的计算时间和内存使用量。

对于不平衡的病例对照表型,研究人员引入了一种快速的近似Firth logistic回归检验。该方法非常适合利用分布式计算框架。研究人员使用多达407746名个体的UK Biobank数据集证明了这种方法的准确性和计算优势。

据了解,具有数千个表型队列的全基因组关联分析在计算上是昂贵的,尤其是在考虑样本相关性或群体结构时。

标签: 基因组 矩阵 片段 内存

关闭
新闻速递