logo

logo

产品服务

Sequencing services

DNA测序 -
RNA测序+
蛋白质组学+
代谢组学+
单细胞测序+
时空组学+
Dr. Tom系统+
其他服务+
  • 首页全外显子组测序

全外显子组测序

       全外显子组测序(Whole-exome sequencing, WES)是一种广泛应用的基因组测序技术。与全基因组测序(Whole-genome sequencing, WGS)不同,WES 主要关注基因组中的外显子区域,即负责编码蛋白质的部分。外显子组约占整个基因组的 1.5%[1],包含了大约 2.2 万个基因,鉴于超过 85% 的孟德尔遗传病与这部分基因组相关[2],WES 因此成为了临床实践中一种更为高效且经济的选择。


产品优势

1.高效精准、省力好用:直接对蛋白编码序列测序有效降低测序费用、储存空间和工作量,更适合高深度测序,可发现变异频率低于1%的罕见变异;

2.质控完整、质量卓越:DNBSEQTM对 InDel 检测有更好的灵敏度,配合严格规范的项目流程和质量体系,为项目质量保驾护航;

3.应用更新:联合国内首家肿瘤新抗原药物研发公司,提供优质的新抗原预测服务;

4.经验丰富、研究广泛:累计项目经验超十万例样品,发表相关文章上百篇;涉及二十多种肿瘤类型与复杂疾病;罕见病研究性文章过百篇。


产品应用

      相比于全基因组测序,外显子区域占比小(约1%),因此更容易做到更高深度测序,检测到更多低频和罕见变异,同时也能降低测序费用和存储空间。外显子测序,50M的捕获区域,测序数据量10-12Gb就可以得到100X的有效测序深度。这个特性决定了外显子测序在遗传性疾病和肿瘤研究中的重要作用,特别是做肿瘤异质性研究。由于肿瘤异质性,肿瘤内部有很多亚克隆,有些亚克隆的占比很低,应用外显子高深度测序可以更快、更经济地检测出普通测序深度难以发现的体细胞突变。  

1

图1 外显子测序产品应用

1. 孟德尔遗传病研究:

WES可以应用于家系样本和散发样本的遗传病研究。经WES及分析后,过滤掉对功能无影响的变异及公共数据库中的常见变异,最终确定候选变异信息。

2. 肿瘤基因组研究:

WES可用于研究遗传易感性、致病机理(驱动基因)、肿瘤异质性、庄毅和复发/耐药机制、新抗原与疗效等。

3. 复杂疾病研究:

对于新生突变家系,通常以核心家系为单位进行研究,寻找在患者中存在而父母中没有的突变。对于散发样本,建议使用大样本量进行 Case/Control 研究。

4. 药物基因组学研究:

外显子组数据可以提供比常用的芯片更有价值的药物基因组学信息。研究通常会选择药物暴露的患者个体、正常个体以及未接受药物治疗的正常个体,以探究个体遗传变异与药物反应之间的机制。

5. 人群队列研究:

从全面性和准确性角度考虑,以及考虑到对低频(0.5% < MAF < 5%)和罕见突变(MAF < 0.5%)的研究趋势,推荐采用高通量测序技术,其中全外显子组测序是一个优选方案。

6. 医学临床诊断:

临床全外显子组测序是疑似罕见孟德尔疾病的最佳诊断方法之一。当患者已经排除了常见的单基因缺陷,同时又考虑到多基因缺陷的检测方法较为昂贵时,临床 WES 成为了最优选。

在一些临床异质性强(同一基因可引起不同的临床表型)和基因异质性强(同一临床表型可由不同的基因突变引起)的疾病中,如癫痫、智力障碍等,临床 WES 检测相对于传统的 panel 检测具有明显的优势。


技术概况

       全外显子组测序使用探针捕获技术对外显子区域的 DNA 进行捕获,然后基于 DNBSEQ 自主测序平台进行全外显子组测序。获取的数据经过质控后进行生信分析,可用于识别遗传变异,包括孟德尔疾病和常见疾病,如米勒综合征和阿尔茨海默病,也能够快速、高效、高深度地检测出个体或群体的变异情况,获得如单核苷酸多态性(SNP)、插入缺失变异(InDel)、结构变异(SV)以及拷贝数变异(CNV)等的变异信息。

       获得高质量数据是确保生物信息分析结果正确、全面、可信的前提。当样品送达华大后,华大对样品检测、建库、测序的每一个生产步骤都进行了严格的把控,从根本上确保了高质量数据的产出,从源头上保证测序数据的准确性、可靠性。

2

图2 DNBSEQTM平台外显子建库流程


信息分析

        信息分析从测序的下机数据(raw data)开始,原始下机数据过滤掉接头、低质量碱基、未测出的碱基后比对到参考基因组上,进行SNP检测和InDel或者CNV分析,然后通过数据库注释,对变异检测的结果通过基于变异有害性、样本情况和基因功能表型三种分析策略,筛选出于疾病相关的有害性位点或基因。另外, 为了保证高质量的测序数据,在整个分析流程中设置了严格的数据质控体系。


网站更新1


图5 疾病信息分析内容

       外显子测序主要适用于肿瘤易感性、致病机理、癌症异质性、转移和复发以及药物疗效研究。其中癌症异质性需要高深度测序,建议200X以上有效深度,FFPE样品建议200-300X对应的数据量,需要尽量全面、准确地检测肿瘤组织发生的所有突变信息,所以测序深度需要尽可能高,以检测低丰度突变位点。ctDNA建议500X及以上有效测序深度,用于检测Somatic 突变以及频率来判断ctDNA的存在和水平,从而反应肿瘤负荷等信息。

网站更新2

图6 肿瘤信息分析内容

*此外华大也可结合客户的需求,协商定制化信息分析内容。


参考文献

1. Ng SB1, Turner EH., et al. Targeted capture and massively parallel sequencing of 12 human exomes. Nature.461(7261):272-6.

2. Choi M1,Scholl UI., et al. Genetic diagnosis by whole exome capture and massively parallel DNA sequencing.Proc Natl Acad Sci USA. 106(45):19096-101.




案例一 全外显子组联合转录组和蛋白组,实现多组学分析,揭示子宫内膜样腺癌分子特征

Proteogenomic insights into early-onset endometrioid endometrial carcinoma: predictors for fertility-sparing therapy response

发表期刊:Nature Genetics

影响因子:31.7

发表时间:2024年4月

          本文是一篇深入研究早期发病的子宫内膜样腺癌(Early-onset endometrioid endometrial carcinoma, EEEC)的多组学研究,旨在揭示这类癌症的分子特征,并探索其与生育保留治疗反应的预测因子。研究团队通过大规模的多组学分析,对215位患者进行了研究,其中包括81位早期发病的子宫内膜样腺癌患者。子宫内膜癌是女性中第六大常见癌症,特别是在年轻女性中的发病率不断上升。对于40岁以下希望保留生育能力的患者,早期发病的子宫内膜样腺癌(EEEC)的治疗尤为关键。本研究旨在阐明EEEC的分子特征,并确定可能影响生育保留治疗效果的生物标志物。

          全外显子组测序(WES)在本研究中扮演了关键角色,它不仅揭示了早期发病子宫内膜样腺癌(EEEC)的深层分子机制,还识别了与疾病发生发展紧密相关的特定基因变异。WES的应用有助于理解环境因素如何通过基因组上的特定突变特征影响肿瘤的产生,同时为发现潜在的治疗靶点和生物标志物提供了重要信息,进而推动个性化医疗的发展。研究团队采用了WES技术对215位子宫内膜癌患者的肿瘤样本进行了深入分析,其中包括81位早期发病的患者。通过严格的数据质量控制和高通量的测序手段,研究者们识别并定量分析了体细胞突变,包括点突变和插入/缺失,同时开发了3D-Sig-Explorer算法来量化特定突变特征对个体突变的贡献,为研究提供了强有力的技术支持。WES的分析结果揭示了与环境暴露相关的突变特征在EEEC中的显著性,尤其是CTNNB1和SIGLEC10基因的热点突变。这些发现不仅加深了对EEEC分子特性的理解,还有助于构建中国人群遗传变异的数据库,为未来的遗传流行病学研究奠定了基础。此外,WES结果还为临床治疗提供了新的视角,尤其是在生育保留治疗的个体化方案设计上,有助于指导未来的治疗策略。

           中文网页更新-全外显子组测序-20241015-cyf1086

图1 研究流程图


高清1

图2 与暴露组相关的突变特征对EECs的早期发病有很大影响

参考文献:Hu Z, Wu Z, Liu W, Ning Y, Liu J, Ding W, Fan J, Cai S, Li Q, Li W, Yang X, Dou Y, Wang W, Peng W, Lu F, Zhuang X, Qin T, Kang X, Feng C, Xu Z, Lv Q, Wang Q, Wang C, Wang X, Wang Z, Wang J, Jiang J, Wang B, Mills GB, Ma D, Gao Q, Li K, Chen G, Chen X, Sun C. Proteogenomic insights into early-onset endometrioid endometrial carcinoma: predictors for fertility-sparing therapy response. Nat Genet 2024; 56: 637–651. [DOI: 10.1038/s41588-024-01703-z]


案例二 全外显子组测序助力基于靶向基因面板的肿瘤突变负担(TMB)评估的质量提升方法

Enhancing the quality of panel-based tumor mutation burden assessment: a comprehensive study of real-world and in-silico outcomes

发表期刊:npj Precision Oncology

影响因子:6.8

发表时间:2024年1月

          本研究针对肿瘤突变负担(TMB)的评估质量进行了深入分析。TMB作为预测实体瘤患者对免疫疗法反应的关键生物标志物,其评估的准确性对临床治疗决策至关重要。本研究旨在通过综合实际样本与计算机模拟(in-silico)的结果,提出提高基于面板的TMB评估质量的方法。

          全外显子组测序因其高深度、高成本效益的优势,在肿瘤研究中体现出极高的应用价值。WES的应用使得研究者能够识别关键的突变,包括那些对免疫疗法反应预测至关重要的突变,从而为TMB的准确计算奠定了基础。研究中,WES揭示了超过1.04 Mb的外显子区域和至少389个基因是实现基本离散准确性所必需的。此外,WES数据支持了对体细胞突变检测的精度要求,即召回率与精确度的倒数差距需小于0.179,以确保TMB评估的可靠性。WES还强调了在TMB计算中包括同义、无义和热点突变的重要性,以及确定了5%变异等位基因频率(VAF)作为至少20%肿瘤纯度样本的适宜截止值。通过WES,本研究不仅提高了对TMB评估技术因素的理解,而且为临床实验室优化TMB检测方法提供了科学依据。WES的深度覆盖和高分辨率为肿瘤基因组学研究和精准医疗实践提供了宝贵的资源,展现了其在肿瘤研究中不可替代的作用。

中文网页更新-全外显子组测序-20241015-cyf2346

图3 研究流程

转换2

图4 基于panel的TMB检测工作流程

参考文献:Zhang Y, Wang D, Zhao Z, Peng R, Han Y, Li J, Zhang R. Enhancing the quality of panel-based tumor mutation burden assessment: a comprehensive study of real-world and in-silico outcomes. npj Precis Onc 2024; 8: 1–13. [DOI: 10.1038/s41698-024-00504-1]


案例三 队列分析:外显子和基因分型联合,结合功能研究,找到先天性巨结肠的新致病基因

Molecular Genetic Anatomy and Risk Profile of Hirschsprung’s Disease

发表期刊:New England Journal of Medicine

影响因子:96.2

发表时间:2019年4月

          先天性巨结肠是一种肠神经系统发育障碍疾病,是新生儿和婴儿肠梗阻最常见的原因。这类疾病具有80%以上的遗传性,包括一些与肠道神经系统相关的罕见和常见的基因序列变异或者是一些肠神经发育受累及的单基因遗传病或染色体综合征。作者通过对 190 名患者进行了全外显子组测序以及基因分型,从单核苷酸变异、拷贝数变异到核型变异,来寻找先天性巨结肠的分子学机理,通过 WES 的检测,在入组患者中一共发现了7个疾病相关的新致病基因。文章研究策略:较大的患者群+重点通路富集分析+完善的功能研究+统计学分析,得出患者受益的相关患病风险和遗传咨询依据,环环相扣。

中文网页更新-全外显子组测序-20241015-cyf3100

图5 文章研究思路

参考文献:Tilghman JM, Ling AY, Turner TN, Sosa MX, Krumm N, Chatterjee S, Kapoor A, Coe BP, Nguyen K-DH, Gupta N, Gabriel S, Eichler EE, Berrios C, Chakravarti A. Molecular Genetic Anatomy and Risk Profile of Hirschsprung’s Disease. N Engl J Med 2019; 380: 1421–1432. [PMID: 30970187 DOI: 10.1056/NEJMoa1706594]

以下是DNBSEQ外显子测序数据的结果展示。

其中标准品为“瓶中基因组(Genome in a Bottle)”的人类样本NA12878,这是目前被世界上认为研究较为透彻的二倍体人类基因组,并发布了高置信变异集,可作为一个重要工具来了解测序仪和检测结果的表现。

下机数据质量高

下图为碱基分布平衡情况。从图中我们可以看到碱基分布平衡性好,N序列也很少。

中文网页更新-全外显子组测序-20241015-cyf3502

图1 DNSBEQ 外显子碱基分布

Q 值反映平台的测序准确性。下图是部分商业样品的测试数据,其中 Q20 平均 98.8%,Q30平均 95.6%。数据质量非常高。


中文网页更新-全外显子组测序-20241015-cyf3591

图 2  DNBSEQ外显子下机数据质量

对比率高,覆盖度均一

在 100X 左右时,DNBSEQ 平台在 DUP、覆盖度(99.7%)上都有卓越的表现。DNBSEQ平台表现出较好的捕获效率使其数据量平均在 12 G 即可满足深度要求。

表格 1  不同外显子探针在DNBSEQ测序平台上的数据表现

 Alignment Agilent V6_1 Agilent V6_2 Agilent V6_3 Agilent V8_1 Agilent V8_1 Agilent V8_1
 Raw data / Gb 12.36 12.36 24.15 8.86 9.22 9.26
 Capture efficiency (%) 54.57 58.34 51.35 53.73 55.40 57.44
 Mapping rate (%) 99.77 99.82 99.94 99.92 99.91 99.92
 Duplication (%) 14.34 12.09 15.91 9.23 6.52 6.49
 Mismatch rate (%) 0.45 0.45 0.30 0.31 0.31 0.31
 Average depth (X) 111.55 119.25 307.82 118.08 126.81 131.95
 Coverage_1x (%) 99.73 99.72 99.20 99.68 99.69 99.69
 Coverage_4x (%) 99.63 99.62 98.78 99.48 99.54 99.55
 Coverage_10x (%) 99.31 99.30 98.53 99.01 99.25 99.30
 Coverage_20x (%) 98.15 97.98 98.18 97.8 98.66 98.82


测序重复性高

150X有效深度时,测序平台的SNP的一致性>98%,InDel的一致性>81%。BGISEQ-500平台外显子测序结果的重复性表现非常好,表明该平台测序结果稳定、可靠。

 BGISEQ-500 外显子重复性分析

图3 DNBSEQ外显子重复性分析


突变变异检测优异

DNBSEQ平台通过其独特的技术优势,在WES中实现了对SNP和InDel变异的高度敏感检测,并且保持了良好的特异性,为后续的生物信息学分析提供了可靠的基础数据。


中文网页更新-全外显子组测序-20241015-cyf6267

图4 DNBSEQ外显子SNP检测的精确度和灵敏度表现

组织样品送样建议


 组织类型 需求量及寄送方式
 新鲜培养细胞 (细胞数)≥ 5×10cells,离心后液氮速冻,-80°保存,干冰寄送。
 新鲜动物组织干重≥ 50mg

1. 液氮速冻法:分割成 50mg 小块后,液氮速冻,放入干净的带螺纹旋盖的保存管中。-80°保存,干冰寄送。≥ 50mg

2. 商业核酸保护液保护法:严格按照说明书操作,组织厚度保持在 5mm 左右,活体组织离体后建议 3 分钟内液氮速冻。

 全血(哺乳动物)

 ≥ 1 mLEDTA 抗凝管采集。新鲜采集的用移液器转移至 2mL 的离螺纹旋盖管,足量冰袋或者干冰寄送;冷冻血液,干冰寄送。
 FFPE

10 张以上未经染色,组织面积大于 100 mm2,厚度为 5-10 μm 的切片,其中有核细胞数含量占 80%以上,肿瘤细胞组织区域占 70%以上,常温保存寄送。

注:详细送样建议请参考华大官方发布的核酸和组织送样建议,或登录MyBGI点击“送检单填写”查看相关送样建议。

注意事项:

1.  1. 2 mL 螺纹旋盖保存管。

2.   组织样品保存方法选择:首选液氮速冻;没有液氮条件的,可直接放入-80°C冰箱冻存; 环境条件限制的,可使用商业核酸保护液保存,并严格按相应试剂说明操作。

3.   长年保存的组织:保存时间超过一年的组织不建议送样。



DNA 样品送样建议


 样品总量 样品体积 样品浓度 完整性(胶图) 纯度
 0.5 μg 15 μL 12.5 ng/μL 主峰 > 20 Kb 无蛋白,RNA/盐离子等污染,样本无色透明不粘稠

注:详细送样建议请参考华大官方发布的核酸和组织送样建议,或登录MyBGI点击“送检单填写”查看相关送样建议。


注意事项:

1.   务必附上凝胶电泳、NanoDropTM、Qubit®、Agilent Bioanalyzer等其中至少一种的检测结果,电泳图需标明所用marker的条带大小。

2.   样品质量以BGI的质检结论为准,望合作伙伴理解,检测结果可能会由于检测地点,仪器设备和操作者等不同造成固有差异。因质检有一定的消耗量,合作伙伴寄送的样本量必须高于各产品样品标准至少50ng以上。强烈建议根据2倍以上标准制备样品,否则很可能会导致大量样本质检未能达标,延误项目进展。

3.  BGI原则上只接收1.5mL/2.0mL EP管,要求每管样品体积在15-100μL之间(推荐30μL),根据实验要求,如果样品体积小于15μL,BGI可能会在检测之前稀释原始样品。

1. 肿瘤研究推荐测序深度?肿瘤样品如何选对照样品?

癌组织推荐200X以上,癌旁推荐100X以上,具体根据客户研究目的及经费情况可以调整。对于全外显子组测序,实体瘤一般选择癌旁或者血液作为对照,血液肿瘤可以选口腔细胞或者皮肤作对照组。


2. 癌症分析时为什么需要成对样本? 

Germline Mutation(胚系突变)和 Somatic Mutation(体细胞突变),前者侧重于可遗传的、个体背景中所有细胞携带的突变,主要用于遗传易感性及药物基因组学的相关研究;后者侧重于肿瘤细胞特有、正常细胞没有的一类突变,通过寻找肿瘤与正常细胞间突变信息的差异,进一步研究癌症发生发展的机制。


3. 外显子捕获效率是什么?

全外显子组测序过程中要用到杂交过程。在人的染色体上有许多与外显子有同源性的部分,这些有同源性的部分很可能在杂交过程中也被捕获下来。所以,测到的序列中,有一部分不是外显子序列。我们把测序得是外显子的部分占全部测序序列的比例称为捕获效率。


4. 外显子捕获测序的效率如何?

平均测序深度大于 30X 时, 外显子组覆盖度达到杂交芯片可捕获的不低于 90% 的目标区域,可发现杂交芯片可捕获区域中 99% 的 SNPs(单核苷酸多态性)。 建议外显子组测序的测序深度为大于 100X 以上。对于肿瘤或者应用于临床上的研究,我们建议高深度测序。


5. 全外显子组测序一般推荐的测序深度是多少?

深度根据客户/合作伙伴的研究目的和样品数量而定。一般建议有效测序深度至少大于 100X以上。因为有文献报道,全外显子组测序的深度影响变异检测率,随着测序深度的升高,变异检出率增大,且达到一定深度时,变异检测达到平稳状态。内部的测试数据显示,在 100X 有效测序深度下的全外显子组测序中,SNP 在各深度梯度下的检出率、20X的覆盖比例均达到一个很平稳的状态,可得到最显著有效的变异检出。


6. 全外显子组测序在研究性染色体上的基因和常染色体上有没有区别,性染色体在捕获上有什么难度?

全外显子组测序技术是通过芯片杂交来富集外显子区域,再通过新一代测序技术对捕获的外显子进行测序。相对于常染色体,性染色体X和Y之间同源性比较高,测序后组装过程中,同源序列定位就比较困难,因此如何区分两种性染色体上的基因则成为研究的难点。


7. 在全外显子组测序结果中出现是内含子或非编码区的结果,而且要比外显子的数据还多,这是为什么?

WES的实际捕获区间是大于外显子区域的,会捕获到内含子或非编码区的序列而检测变异的过程是检测全部数据的变异,所以会检测到内含子或非编码区。从项目经验来看,确实会有内含子或者非编码区的变异数目比外显子区的变异数目多的情况。结果的可信度是看这个位点的覆盖深度、质量等信息,而不是看结果在哪个区域。在测序深度、质量和位点覆盖深度都达标的情况下,建议重点关注外显子区的结果。


8. 在全外显子组测序中,如何判断 CNV 缺失的可信度?

WES检测的CNV假阳性较高,可信度不如WGS的检测结果。若关注的基因出现了CNV的注释,可以去bam文件中确认该位置的reads覆盖情况,以 bam文件中的结果为主,后期可根据结果再进行验证分析,若无显著缺失,不建议关注此CNV。


9. Duplication 是什么,又是如何产生的呢?

在基因组测序中,我们说的 duplication 是特指的 PCR-duplication。也就是,在 PCR 过程中产生的基因重复片段。因为在测序过程中,为了确保测序效果一般将加好接头的 DNA 片段过量扩增,确保每一个孔中都能覆盖到足够多的片段。因此,同样一个 DNA 片段会扩增出多份拷贝,而这些拷贝有可能也会进入到孔中被测出来。这就会导致这个 DNA 位置的覆盖度升高,故需执行去重步骤。

深圳华大科技(总部)

电话:400-706-6615
邮箱:info@genomics.cn

对话图标