冠状动脉疾病(CAD)是全球主要的心血管病致病原因之一。虽然基因组广泛关联研究(GWAS)揭示了大量与CAD相关的遗传变异位点,但这些位点与疾病机制的具体联系仍然不清晰。本研究旨在通过新的分析方法,将GWAS数据与表观基因组和基因功能数据结合,探索CAD的潜在分子机制,尤其是关注内皮细胞在CAD遗传风险中的作用。
该研究创新点是提出了一种新的“变异-基因-通路”(V2G2P)分析方法,通过五个步骤将GWAS变异与基因和内皮细胞中的特定通路联系起来:
1. 系统的变异到基因(Variant-to-Gene, V2G)映射
V2G2P方法的第一步是将GWAS中识别出的风险变异与其潜在靶基因系统地关联起来,利用内皮细胞中特异的表观基因组数据来识别CAD风险位点的作用靶基因。这一步骤主要采用以下几种创新手段:
表观基因组数据:研究利用内皮细胞的RNA测序(RNA-seq)、ATAC-seq(染色质开放性测序)和H3K27ac ChIP-seq(组蛋白乙酰化测序)等表观数据,结合活动-接触(ABC)模型预测基因的调控情况。这些表观基因组数据提供了变异位点在细胞中的具体功能信息,使得研究能更精准地找到与风险变异相关的靶基因。
细胞特异性:该研究关注的细胞类型为人类主动脉内皮细胞模型,这是一种在CAD发生和发展过程中具有关键作用的细胞类型。通过这种细胞特异性的选择,研究得以精准锁定在冠状动脉疾病相关的关键调控基因和信号通路上。
全基因组关联:研究中收集的GWAS信号覆盖了306个CAD风险信号,包含大量非编码变异位点,而这些位点通常不直接编码蛋白质但会通过调控基因表达来影响疾病风险。V2G2P的全基因组关联能力确保了研究不会错过任何可能的疾病相关基因。
这些创新手段的结合显著提升了V2G2P方法在识别变异靶基因时的特异性和全面性,克服了过去对GWAS变异位点功能难以确定的局限。
2. 去偏倚的基因到通路(Gene-to-Program, G2P)映射
G2P2P方法的第二步通过Perturb-seq技术构建基因到通路(G2P)映射,能够在不依赖先验知识的情况下,发现多个基因在内皮细胞中的协同表达通路,显示出以下优越性:
CRISPR干扰技术与单细胞测序结合:研究团队通过CRISPR干扰(CRISPRi)技术对每一个候选基因进行单独的敲低,然后进行单细胞RNA测序(scRNA-seq),以精确量化每个基因敲低后的细胞转录组变化。这种方法结合了基因敲低的因果推断能力和单细胞分辨率的数据量化能力,从而使得G2P2P能够准确识别基因的真实生物功能。
数据驱动的程序发现:利用无监督非负矩阵分解(cNMF)来处理Perturb-seq数据,研究团队发现了50个去偏倚的基因程序,并在无先验知识的前提下识别出疾病相关的基因协作通路。传统的研究通常依赖已知的通路或基因集,难以捕捉新机制,而V2G2P方法无先验知识的特点避免了传统通路分析的偏见,使得研究具有更广泛的探索能力。
复杂遗传网络的高效映射:通过对基因敲低后细胞内的转录组变化进行系统性分析,G2P映射能识别出多个协同作用的基因通路,揭示了多个CAD风险基因如何在内皮细胞中通过共同的通路影响CAD。相比于以往针对单一基因或通路的研究,这种大规模、高通量的基因到通路映射更为高效。
3. 变异到基因到通路(V2G2P)的收敛性分析
V2G2P方法的第三步为V2G2P收敛性分析,旨在检测风险变异是否在某些基因程序中富集。此步骤不仅提高了识别疾病相关基因的能力,还在CAD的遗传变异和内皮细胞的信号通路之间构建了更直接的关联:
收敛性检验的统计严谨性:研究中开发了统计检验工具,通过计算变异相关基因是否富集在特定基因程序中,能够客观确定CAD遗传风险位点是否收敛到某些特定的内皮细胞通路。这种基于统计的收敛分析手段能够提供更为可靠的信号,避免偶然发现。
多层信息的整合:V2G2P将GWAS的变异基因关联数据与Perturb-seq生成的细胞通路数据结合起来,能更准确地解析CAD风险基因的功能通路。通过这种整合分析,V2G2P在43个GWAS位点上发现了特异的内皮细胞基因程序收敛现象,揭示了TLNRD1和CCM2等关键基因在CAD中的新机制。
4. 发现新功能基因的潜力
V2G2P方法在解析未知基因功能方面具有很大的优越性。例如,本文研究发现了TLNRD1这个之前未在CCM信号通路中报道的基因,并提出它可能是这一通路的新成员。通过V2G2P分析,研究验证了TLNRD1的敲低对CAD的潜在保护作用,这进一步展示了该方法在发现新型疾病相关基因方面的能力。
5. 广泛的适用性和可推广性
V2G2P方法不仅适用于CAD的研究,还具有很强的通用性,可推广至其他复杂性疾病的研究。本文中还进行了高血压等其他心血管特质的V2G2P分析,发现这些特质与CAD相比在不同的基因程序中富集,这表明该方法可以通过在不同细胞类型和疾病特征上进行应用,从而挖掘出与特定疾病相关的生物通路和基因网络。
综上所述,V2G2P方法通过系统的变异-基因-通路映射、高效的去偏倚基因程序发现以及多层信息整合分析(如下图),为CAD的遗传机制研究提供了一种新的思路,具有以下几个显著优越性:更准确地识别GWAS风险位点的靶基因;去偏倚地发现疾病相关的基因协作程序;在遗传风险变异和细胞特定通路之间建立更直接的联系;在未知基因功能的探索上展现出更强的潜力;具有广泛的适用性,可推广至其他多基因疾病研究中。
V2G2P方法示意图
通过这些创新点,V2G2P方法为未来的遗传学和分子生物学研究提供了强大的工具和理论基础,对我们团队的研究特色有较好的借鉴作用,有望推动我们对复杂疾病的分子机制理解和新药研发。
参考文献:Gavin R Schnitzler , Helen Kang ,et al.Convergence of coronary artery disease genes onto endothelial cell programs. Nature. 2024 Feb;626(8000):799-807. doi: 10.1038/s41586-024-07022-x. Epub 2024 Feb 7.