logo

logo

产品服务

Sequencing services

  • 首页动植物全基因组重测序

动植物全基因组重测序

     全基因组重测序是对已知基因组序列的物种进行DNA测序,并在此基础上完成个体或群体分析。全基因组重测序通过序列比对,可以检测到大量变异信息,包括单核苷酸多态性(SNP)、插入缺失(InDel)、结构变异(SV)和拷贝数变异(CNV)等。基于检测到的变异能进一步研究动植物的物种特性、群体进化问题、定位目标性状基因位点。

       随着测序成本降低和已知基因组序列物种的增多,全基因组重测序已经成为动植物分子育种、群体进化中最为迅速有效的方法之一。利用全基因组重测序技术有助于快速发现与动植物重要性状相关的遗传变异,应用于分子育种中,缩短育种周期


产品优势

·         技术简单,稳定性好

·         检测变异类型丰富:可以检测SNP、InDel、SV和CNV等多种变异类型,并可用作分子标记。

·         高密度标记: 能够检测到全基因组范围的SNP信息,同时可检测低频SNP。

·         发现新的变异:与芯片方法相比较,可以检测到新的变异序列。

·         高性价比:与全基因组从头测序相比,耗时更短,成本更低。

·         样品起始量低:华大基因经过不断的研发,样本起始量不断降低,最低可至pg级。

·         个性化分析:具有丰富个性化分析经验,可根据项目需要选择最适宜的分析软件,只为保障最精准结果。

·         数据精准:华大至今完成10万+的动植物重测序样本,严格质量控制流程保证结果准确度。

·         经验丰富:动植物重测序领域挂名发表文章60余篇,IF加和>600,其中一作或通讯作者文章40+,涵盖变异检测、遗传图谱构建&QTL定位、群体进化和GWAS等各研究领域。

·         项目方案支持:大项目参与方案设计,使项目赢在起跑线。

·         分析团队实力雄厚:发表影响因子10分以上动植物研究文章的人员20+。

·         自主测序平台,成本可控:测序平台选择多样,可选择BGI自主测序平台,成可控。


信息分析内容



产品应用


群体研究案例—3K水稻重测序&泛基因组研究

       由中国农业科学院作物科学研究所牵头,联合IRRI、上海交大、华大基因、深圳农业基因组研究所、安徽农大等16家单位共同完成了“3000份亚洲栽培稻基因组研究” ,并于2018年4月发表在《Nature》上。研究针对水稻起源、分类和驯化规律进行了深入探讨,揭示了亚洲栽培稻的起源和群体基因组变异结构,剖析了水稻核心种质资源的基因组遗传多样性。

       3000份水稻(来自全球89个国家和地区)代表了全球78万份水稻种质约95%多样性的核心种质。通过全基因重测序,每个样本平均测序深度14X,利用重测序数据共检测到32M的高质量SNPs和InDels。对亚洲栽培稻群体的结构和分化进行了更为细致和准确的描述和划分,由传统的5个群体增加到9个。研究着重分析了453个测序深度>20X品系的SVs,利用SVs构建的进化树与SNP构建的进化树类似。大量的SVs可能是不同程度杂种不育和XI与GJ杂种衰退的遗传基础。同时构建了亚洲栽培稻的泛基因组,包括12,770个(62.1%)核心(core)基因家族和9,050个(37.9%)分散式(distributed)基因家族。发现了1.2万个全长新基因和数千个不完整的新基因。核心基因比较古老,大多数的新基因表现更年轻和长度偏短。


图1  水稻泛基因组研究

a、基因家族PAVs;b、泛基因组和一个单独的基因组的组成成份;c、基于500个随机筛选的水稻基因组模拟泛基因组和核心基因组;d、核心和分散式基因家族比例;e、两个品系间基因家族平均数量差异;f、5733主要群组不平衡基因家族特性


群体进化案例—高粱进化,一个项目七篇文章

          华大和昆士兰大学共同合作,利用44株高粱的重测序数据研究群体进化问题,从2013年到2017年间,在著名期刊发表了7篇文章。44株高粱,其中17株是改良种,18株是地方种,还有2株驯化种以及7株野生种,另外还有同属的2个拟高粱(S. propinquum)。群体利用全基因组重测序技术获得了基因型数据,数据平均有22X的深度。


图2 44个高粱样本情况

表1 高粱项目发表7篇论文汇总

发表时间

发表期刊

研究方向

文章名

影响因子

2013.8

Nature communications

利用全基因组SNP”研究高粱群体进化

Whole-genome sequencing reveals untapped genetic potential in Africa’s indigenous cereal crop sorghum

11.47

2014.9

BMC Plant Biology

利用抗病基因的SNP”研究高粱进化

The plasticity of NBS resistance genes in sorghum is driven by multiple evolutionary processes

3.813

2016.1

Biotechnology for Biofuels

构建SNP数据库

SorGSD: a sorghum genome SNP Database

6.044

2016.5

Plant Biotechnology Journal

利用淀粉代谢途径相关基因研究进化

Domestication and the storage starch biosynthesis pathway: Signatures of selection from a whole sorghum genome sequencing strategy

5.752

2016.12

Frontiers in Plant Science

利用氮代谢途径相关基因研究进化

Whole Genome Sequencing Reveals Potential New Targets for Improving Nitrogen Uptake and Utilization in Sorghum bicolor

4.495

2017.7

Frontiers in Plant Science

利用高粱谷粒大小和重量基因研究进化

Whole-Genome Analysis of Candidate genes Associated with Seed Size and Weight in Sorghum bicolor Reveals Signatures of Artificial Selection and Insights into Parallel Domestication in Cereal Crops

4.495

2017.11

Molecular Breeding

高粱不同品系有关硝酸还原酶和谷氨酸合成酶的不同等位基因影响植物氮反应

The vegetative nitrogen response of sorghum lines containing
different alleles for nitrate reductase and glutamate synthase

2.246


变异检测

         全基因组重测序数据与参考基因组比对,可以检测某物种个体或群体的遗传变异信息,包括单核苷酸多态性(SNP)、插入缺失(InDel)、结构变异(SV)、拷贝数变异(CNV)。变异信息是进行其他信息分析的基础。


 图1 各种变异在基因组上分布统计

从外到内依次为:染色体坐标、SNP密度分布、InDel密度分布、SV类型分布、CNV的拷贝数分布。


群体结构分析

       通过构建群体的系统进化树(图2a)、主成分分析(图2b)和Structure分析(图2c),研究样本间的亲缘关系和进化关系。进化树是根据样本间亲缘关系的远近,把各样本安置在有分枝的树状的图表上,简明地表示生物的进化历程和亲缘关系。主成分分析(Principal Component Analysis,PCA),是将多个变量通过线性变换以选出较少个数重要变量的一种多元统计分析方法。群体结构研究的过程中通过将测序品系和SNP位点构成二维矩阵数据,经过PCA分析,计算出几个主要的特征向量,并且将每一个品系在各特征向量上进行定位,也是研究群体品系间亲缘关系的方法之一。Structure分析则是假设若干个品系起源于K个截然不同(或差异较大)的祖先,分析每一个品系的遗传成分中,所具有的每一个假想祖先成分的比例。三种分析方法的结果可以相互验证。


图2 群体结构分析( Nature genetics, 2010, 42(12): 1053-1059)。

a为进化树;b为PCA分析;c为Structure分析,不同颜色代表不同的假想祖先;d为连锁不平衡分析


连锁不平衡分析

        连锁不平衡(linkage disequilibrium,LD),指群体内不同座位等位基因之间的非随机关联, 包括两个标记间或两个基因间或一个基因与一个标记座位间的非随机关联,可以用r2计算两个标记间的连锁不平衡度。LD受重组、人工选择、群体类型等的影响,不同的物种LD变化情况不同,一般情况下我们会统计LD值衰减到一半的距离(图2d)。LD值会对信息分析中标记数目的选择有指导意义,LD大的物种所需要的标记密度相对低。


选择分析(条件:群体有明显的亚群分化)

       选择在物种的遗传变异形成过程中有巨大的贡献,其中搭便车效应会对种群水平的分化产生剧烈的影响,由于较强的选择效应,使得一个突变位点相邻DNA上的核苷酸之间的差异下降或消除(selective sweep)。通过分析大量的比较基因组学数据集和大量的SNP集,我们可以确定在野生种到栽培种/地方种的过程中,以及在不同的环境情况下,哪些区域的多态性发生了巨大的改变,检测驯化或环境适应性相关的候选基因,而且受选择的基因与进化相关的性状也有关系。选择性清除区域亚群内多态性降低,亚群间差异大,LD大。


图3 选择分析结果示例( BMC plant biology, 2015, 15(1): 81)

绿色区域代表栽培种驯化过程中受选择区域


GWAS分析

        利用分布于全基因组水平的分子标记(例如SNP)通过一定的模型(如一般线性模型或混合线性模型)与表型进行关联分析,检测目标性状相关基因位点。但是由于连锁的存在,往往我们检测到的标记并不是直接决定目标性状的变异,如果进行基因克隆时还是要在一定的定位区间内完成。


图4 GWAS结果示例(Nature genetics, 2010, 42(11): 961-967)。

Manhattan plot(图4左)和QQ plot(图4右)是查看GWAS定位结果和计算模型合理性的标配图。Manhattan plot横坐标是表示位置,纵坐标表示-lgP,在纵坐标上超过一定阈值的点被认为和表型关联。QQ图的意义在于基因型和性状无关联的情况下,各个标记P-value的观察值和期望值是相等的(红线),但是由于出现了基因型和性状有关联的情况,P-value往往会偏离y=x这条线。




表1 基因组 DNA样品送样建议

建库类型

样品类型

总量

浓度

完整性(胶图)

纯度

常规DNA小片段文库

基因组DNA

≥1μg

c≥12.5ng/μL

主峰>20Kb

 

无蛋白,RNA/盐离子等污染,样本无色透明不粘稠

PCR free文库

基因组DNA

≥10μg

c≥30ng/μL

表2 组织样品判定标准

组织类型

常规DNA小片段文库

PCR free文库

新鲜培养细胞 (细胞数)

≥5×106cell

≥1×107cell

新鲜动物组织干重

≥50mg

≥300mg

新鲜植物组织干重

≥200mg

≥800mg

全血(哺乳动物)

≥1 mL

≥2 mL

全血(非哺乳动物)

≥0.5mL

≥1mL




Q1: 进行全基因组重测序数据推荐?

每个样本推荐的数据量与样本类型和要做的信息分析内容相关。例如关注个体样本的SNP,对SNP的准确度和覆盖度要求比较高,一般推荐测序深度>30X,对于稀有变异测序深度还要进一步提高;用于研究群体结构的样本,测序深度推荐5X以上,随着测序成本的不断下降,现在越来越多的项目测序深度在10X以上;纯合样本混样检测等位基因频率,推荐平均每个样本的测序深度在1X以上,混合样本测序深度不低于30X;DH和RIL群体构建Bin Map,子代群体测序深度可以测序0.5X/样本。

Q2: 样本量选择多大合适?

答:样本量大小与样本类型和研究目的相关。例如进行群体进化研究推荐30个样本以上,因为从统计学上说30个以上才属于大样本;对于进行基因挖掘的项目来说,无论是利用自然群体进行GWAS分析或是用家系群体进行连锁分析,都是群体越大越好,一般的情况下进行GWAS分析的样本推荐300个样本以上,对于家系群体推荐200个以上。

Q3: 连锁图谱构建适用于什么样的群体?

答:连锁图谱的构建适用于作图群体,它是由性状差异显著的亲本杂交衍生的群体。亲本选择的要求:要考虑亲本间的遗传多态性、目标性状差异、亲本的纯合度和杂交后代的可育性。构建分离群体类型,根据遗传稳定性可将分离群体分成两大类:暂时性分离群体如F1、F2、BC等,永久性分离群体如RIL、DH等。

Q4: 现在我们重测序数据比对回参考基因组检测SNP用的软件是什么?

答:现在常用的比对和call SNP的软件包括SOAP+SOAPsnp和BWA+GATK,可以根据需求进行选择。

Q4: 重测序reads与参考基因组比对率低,可能的原因是什么?

答:重测序reads比对率低原因可能是:1)因为测序样本与参考基因组亲缘关系比较远。因为动植物品种多样,但是目前已完成基因组组装的往往只是其中的一个品种,同一个物种野生种与驯化种差异还是很大的;2)可能因为DNA不纯,存在其他物种的污染;3)参考基因组序列组装质量较差,引起比对率低;4)比对参数设置严格等。


深圳华大科技(总部)

电话:400-706-6615
邮箱:info@genomics.cn

高通量测序 Sanger测序 合成业务 投诉与建议