- 首页 > 全基因组Bisulfite甲基化测序
全基因组Bisulfite甲基化测序
产品简介
全基因组甲基化Bisulfite测序是DNA甲基化研究的黄金标准,它通过Bisulfite处理和全基因组DNA测序结合的方式,对整个基因组上的甲基化情况进行分析,具有单碱基的分辨率,可精确评估单个C碱基的甲基化水平,覆盖范围广。它可以构建精细甲基化图谱,建立表观遗传学研究数据库,为后续大规模开展不同样品间的甲基化差异分析提供参考图谱。
技术流程
技术优势
技术稳定性、重复性好:从样本检测到文库构建、上机测序,每一步均有严格的标准操作SOP和对应的质控标准,保证每一个样本都得到真实的测序结果。
Bisulfite转化率高:经过不断优化建库方案,华大的甲基化建库BS平均转化率高达99%以上,作为文库构建的质控指标进行严格控制。
单碱基分辨率:精确分析每一个C碱基的甲基化状态。
准确性和可靠性高:准确区分甲基化的C和未甲基化的C。
检测范围广:覆盖全基因组范围内的所有位点。
无偏向性:反映真实的甲基化状态。
经验丰富:执行了上千个项目,数万个样本,合作发表文章一百多篇。
信息分析
1) 数据基本处理与质控
2) 全基因组甲基化水平分析
3) 甲基化C碱基中CG, CHG与CHH的分布比例
4) 甲基化CG、CHG和CHH的甲基化水平分布
5) 甲基化的CG,CHG,CHH附近碱基的序列特征分析
6) 染色体水平的甲基化C碱基密度分布
7) 基因组不同转录元件中的DNA平均甲基化水平
8) 全基因组差异甲基化区域DMR的检测
9) DMR相关基因的GO和Pathway分析
10) 其他定制化信息分析(可结合客户的需求,协商确定定制化信息分析内容。)
案例一: DNA甲基化应用于液体活检(血浆)鉴定早期肿瘤来源[1]
研究背景:近几年研究发现癌症无创检测技术通过液体活检可筛选出死亡癌细胞释放的ctDNA,从而能够检测癌症的早期发生,但却不能得知早期癌症发生的具体位置,在该研究中,张鹍教授和他的团队在血液中利用甲基化单倍型作为新的分子标记,不但可以准确检测出数量极少的癌细胞,而且还可以识别癌细胞在组织中的来源,为了开发该癌症早期检测方法,研究人员收集了10个不同组织(肝脏,肺等)的基因组数据,结合UCSD癌症中心癌症患者的肿瘤样品和血液样品数据进行分析,构建了不同组织癌症特异性甲基化标记数据库,该文章的方法是肿瘤ctDNA液体活检与甲基化检测的全新结合,新的技术能帮助人们更早发现肿瘤的发生位置,意义远大。
应用技术:WGBS、RRBS、基因分型芯片
数据来源:UCSD Moores癌症中心的癌症患者的肿瘤样品和血液样品,以构建癌症特异性遗传标记的数据库。
肿瘤Biomarker:cancer-associated highly methylated haplotype
文章思路:
图1 文章研究思路图解
突出成果:定义了新的肿瘤早筛Biomarker (DNA 甲基化单倍型),新的方法思路,确定肿瘤的来源问题,利用CfDNA进行预测鉴定,并进行准确性验证。
图2 基于MHL方法进行ctDNA癌症组织来源预测
a. 组织特异性MHL在癌症患者的相应组织和血浆样品中可见;b. WGBS和RRBS数据验证MHB方法预测组织来源的准确性 c-将预测模型应用于肿瘤患者和健康个体的血浆样本验证。
案例二:人的年龄与DNA甲基化的相关性研究[2]
案例描述:利用WGBS技术比较了一位103岁老年男子和一名新生男婴的DNA样本,结果他们发现一个出现在1,600多万个位置上,干扰了基因转录的甲基化修饰,在新生儿与百岁老人的细胞中是不一样的。
发表单位:Bellvitge生物医学研究院,巴塞罗那大学,华大基因
影响因子:9.681
案例流程:
研究成果:通过WGBS技术比较了一位103岁老年男子和一名新生男婴的DNA样本,并在大量样本中进行了验证,最终发现与同样细胞类型的新生儿相比,整体上百岁老人DNA中有更多的非甲基化。
图3 百岁老人(红色)与新生儿(蓝色)的甲基化分布
参考文献
[1] Guo S, Diep D, Plongthongkum N, et al. Identification of methylation haplotype blocks aids in deconvolution of heterogeneous tissue samples and tumor tissue-of-origin mapping from plasma DNA.[J]. Nature Genetics, 2017, 49(4):635.
[2] Holger Heyn et al. Distinct DNA methylomes of newborns and centenarians.PNAS, 2012, vol. 109 no. 26,10522–10527.
1、甲基化CG、CHG和CHH的甲基化水平分布
不同类型的C碱基(mCG、mCHG和mCHH ),其甲基化水平在不同物种间,甚至同一物种不同细胞类型不同条件下其甲基化水平都存在差异。此图统计每种类型(CG、CHG和CHH)甲基化C的甲基化水平分布,反映了该物种DNA甲基化特征。
图1 甲基化C位点的甲基化水平分布
2、甲基化的CG,CHG,CHH附近碱基的序列特征分析
在一些真核生物中,甲基化位点附近碱基的序列特征,对反映甲基化发生的序列偏向有指导意义。为了研究序列特征与甲基化偏向性之间的联系,我们计算了甲基化位点上下游9个碱基 (mC位于第四个碱基)的甲基化百分比。
图2 mCG,mCHG,mCHH附近碱基的序列特征分析
3、染色体水平的甲基化C碱基密度分布
有研究证明非CG型的甲基化与CG型甲基化C的密度有很大的差异。染色体亚端粒区域DNA甲基化水平通常较高,这一现象与端粒长度以及重组有十分重要的作用,此外还有基因表达和蛋白与DNA的相互作用都有紧密联系。 如下图的显示,整体的甲基化水平图谱显示DNA甲基化的密度在整条染色体上变化很大。
图3 各染色体上甲基化C的密度分布
4、基因组的不同区域的甲基化分布特征
基因组的不同区域具有各自不同的甲基化模式,也行使着不同的生物学功能,下图中以热度图的形式表示基因组各特征区域的甲基化水平情况,有助于进一步了解这些区域的甲基化特征。
图4 基因组不同区域的甲基化分布,以及相应的CpG密度分布
5、基因组不同转录元件中的DNA平均甲基化水平
为了深入地揭示DNA甲基化与基因表达的内在联系,所有编码基因序列被分成7种不同的转录元件区域,在此基础上对不同转录元件区域的平均甲基化水平进行统计。DNA甲基化水平在不同功能区的分布特点有助于从全基因组水平去了解不同区域的DNA甲基化修饰的作用。
图5 全基因组不同功能元件区域的甲基化平均水平分布
6、全基因组DMR的检测
差异甲基化区域(DMRs)是指不同样品中基因组表现出不同的甲基化模式的某些DNA片段。 DMR与遗传印记相关,在个体中表现为与父本或母本的甲基化状态一致。甲基化的等位基因经常表现为沉默状态。亲本与子代甲基化模式的差异常常导致表观遗传缺陷,而人工繁殖技术可能会导致异常甲基化的比例升高,并导致疾病的发生。我们用滑动窗口的方法检测DMR。在两个样品基因组相同位置上寻找包含至少5个CG(或CHG,或CHH)的窗口,比较该窗口在两个样品数据中甲基化水平的差异,寻找在两个样品中甲基化水平有差异的区域。
图6 基因组DMRs中的甲基化水平分析
7、差异性甲基化区域(DMR)相关基因GO分析
基因本体论(Gene ontology,GO)是所有物种中最主要的了解基因和基因产物属性的生物信息学分析手段,GO分析能够用于鉴定基因产物的性能,它包含了三类基因功能信息:细胞组分(Cellular Component),分子功能(Molecular Function)和生物学过程(Biological Process)。为了探讨表观遗传变异在通路和生物学过程中起到的作用,我们对DMR相关的基因进行了GO分析。
图7 DMR相关基因的GO聚类分析
8、差异性甲基化区域(DMR)相关基因Pathway分析
KEGG (Kyoto Encyclopedia of Genes and Genomes)是有关Pathway的主要公共数据库,该数据库整合了基因组、化学以及系统功能信息,特别是测序得到的基因集与细胞、生物体以及生态环境的系统性功能相关联。所有样品中的DMR相关基因均用KEGG数据库进行分析。
图8 DMR相关基因的Pathway功能显著性富集分析
1、核酸样本
表1 DNA送样建议
样品纯度:OD260/280 = 1.8~2.0,A260/A230≥1.6;没有蛋白、多糖和RNA污染;
样品完整性:DNA无明显降解,需提供凝胶电泳检测胶图;
样品溶剂:建议样品用高质量试剂盒提取,溶于ddH2O。确保溶剂内不含有影响酶活的酒精,苯酚,氯仿或其它有机溶剂。
2、血液样本
送样前处理:要求为全血样本,并加入抗凝剂(非肝素),无血凝块,冷冻后,干冰运输送样。
样品送样标准:全血≥3ml,可得90G bp数据量。
3、组织样本
样品送样标准:按照送样建议做送样前处理,每个样本新鲜组织干重≥50mg,可得到90G bp的数据;如果样本为非新鲜组织,DNA得率会降低,建议多送一些组织。
Q1: Bisulfite-Seq在项目开始之前需要考虑哪些因素?
A1:Bisulfite-Seq在项目开始之前需要考虑以下因素:是否为低甲基化率的物种;该物种的基因组完成情况如何(影响BS-SEQ的比对);基因组是否存在复杂因素:GC含量偏高、杂合度偏高、转座子、重复区域等。
Q2:可以对无参考基因组的物种进行Bisulfite研究吗?
A2:Bisulfite-Seq强烈依赖基因组的完成程度,基因质量的好坏直接影响后续的分析结果,因此更适合有完整基因组信息的物种。
Q3:如果合作伙伴自己建库,能否提供上机测序?如何进行文库质量检测并保证测序质量?
A3:合作伙伴自己建的文库,可以上机测序。如果用标准的Illumina kit,要注明kit的类型及货号。如果不是使用Illumina kit建库,那么合作伙伴提供信息单的同时必须说明建库方法、使用的试剂盒及品牌,以及提供建库所用的接头引物序列和预期文库片段大小。如果是index文库,要注明index的位置以及index的序列。若只完成部分建库过程请务必注明清楚;如果文库是PCR产物建库或者插入片段中有特定序列,请在提供的样品信息单中说明,否则会极大地影响数据质量。对合作伙伴文库的检测,首先用Agilent 2100 Bioanalyzer 确定片段大小是否符合;然后通过Q-PCR精确定量确定上机体积。
Q4:Bisulfite的转化率是多少?
A4:Bisulfite转化率达到99%以上;如果样品的DNA不存在不发生甲基化的DNA作为对照,都会在样品中混入control DNA来验证Bisulfite的转化率。