- 首页 > 代谢组+蛋白组/转录组关联分析
代谢组+蛋白组/转录组关联分析
生物过程具有复杂性和整体性,单一组学的数据难以系统全面地解析疾病发生发展的复杂机制。转录组学在整体水平上研究细胞中基因转录的情况及转录调控规律;蛋白质组学,是研究细胞、组织或生物体蛋白质组成及其变化规律;代谢组学研究生物体内所有代谢物变化规律,并寻找代谢物与生理病理变化的相对关系,是最接近于表型的组学。
代谢组学为蛋白质组学提供了更加表观显著的数据支持,蛋白质组学和代谢组学分析有可能帮助确定将基因型与表型联系起来的潜在因果机制。转录和代谢联合分析可以同时实现从“因”和“果”两个层面来探究生物学问题,相互间进行验证,从海量的数据中筛选出关键基因、代谢物及代谢通路开展后续深入研究与应用,有利于对生物系统调控机。
产品优势
1、从蛋白质/基因和代谢物层面全面揭示生物体表达水平分布,实现生物表达调控全谱分析。
2、充分挖掘两组学特征数据,实现从“因”到“果”两个维度探究相互作用机制。
3、关联分析研究经验丰富,自主及合作发表多篇文献。
产品应用
1、疾病发病机制研究
2、疾病诊断及分型研究
3、植物生长发育调控机制研究
4、植物重要品质性状研究
5、植物抗逆调控机理研究
6、中医中药研究
技术路线
注:差异物种无生物学功能关联
项目周期
12个自然日
案例一:转录组、代谢组学探索秋水仙碱合成通路 [1]
研究背景 :
秋水仙碱来源于秋水仙和嘉兰属植物,是一种美国食品和药物管理局(FDA)批准的治疗炎症疾病的药物。由于缺乏对该药用活性物质在植物中生物合成完整代谢途径的研究秋水仙碱需要直接从药用植物或精物细胞培养中分离。因此开展简单高效的获取秋水仙碱的研究,从而对药用植物来源的生物活性小分子的应用提供重要研究参考。
实验设计 :
秋水仙、嘉兰百合不同组织进行转录组、代谢组分析。
主要结果 :
本研究利用转录组、代谢组学重构代谢途径,在不了解生物合成基因、基因组测序或基因工具的情况下,阐明了一种接近完整的秋水仙碱生物合成途径。从嘉兰百合中发现了8个用于生物合成n-甲酰基秋水仙素的基因。n-甲酰基秋水仙素是秋水仙素前体物质,含有秋水仙素的特征环和药效基团。并且发现了一种非典型的细胞色素P450,它可以催化环膨胀反应,而这种反应需要产生独特的秋水仙碱碳骨架。进一步利用新鉴定的基因,从苯丙氨酸和酪氨酸出发,构建了一条由16种酶组成的n-甲酰基秋水仙素的生物合成途径。本研究建立了秋水仙碱的代谢途径,并揭示了植物利用简单氨基酸生成复杂的生物活性代谢产物的独特化学过程。
图1 转录组、代谢组鉴定秋水仙素生物合成基因
案例二:代谢组与蛋白组寻找COVID-19的生物标志物及药物作用靶点 [2]
实验设计:
联合蛋白质组学和脂质组学、代谢组学技术对COVID-19非重症、重症及健康人进行研究。通过训练集(n=30)发现COVID-19重症患者预测标志物和潜在药物治疗靶点并在两个验证集中进行验证,并根据多组学数据阐释SARS-CoV-2感染机制,为SARS-CoV-2欧病机制解析及COVID-19治疗药物筛选提供理论基础和支撑。
主要结果:
对发现队列的蛋白质组、脂质组和氨基酸检测数据,建立随机牵林机器学习模型,初步筛选到21个脂质和4个蛋白质,共计25个物质组成的panel可作为潜在的预测疾病严重程度的生物标志物;并进一步采用MRM或PRM在两个验证队列中进行了验证。除此之外,该研究发现的标志物组合在公共数据集中也得到了验证。
基于多组学结果发现Apo E可能是巨噬细胞中病毒繁殖和感染的诱导抑制剂。COVID-19患者可能使用PC来产生CDP胆碱的巨噬细胞胆碱胞苷转移酶α出现异常,血浆中PS表达量的上调表明感染过程中存在免疫抑制,并根据血浆中的分子特征,进一步确定了二甲双胍、白藜芦醇、地塞米松、双嘧达莫等药物,有可能用于治疗COVID-19重症患者。
图2 COVID-19多组学研究的实验设计
参考文献
[1] Discovery and engineering of colchicine alkaloid biosynthesis. Nature.2020.
[2] Multi-platform omics analysis reveals molecular signiature for COVID-19 pathogenesis, prognosis, and drugtarget discovery. Signal transcluction and targeted thevapy.2021.
在关联分析中,综合运用了单变量相关性、非监督模型关联、监督模型关联、生物学功能关联。以下为部分分析结果图片展示:
1、适用数据类型
要求用于关联分析的两组学的样本数据一一对应(即用于关联分析的两组学的样本来自于相同的生物学重复个体)。
2、重复次数要求
1)当样本为2组时,每组样本数不少于8个;当样本组不少于3组时,每组样本不少于6个;每组样本大于10个时分析效果较好;
2)用于关联分析的临床样本推荐每组样本数不少于30个;
3)重复数少于建议数时分析效果差;每组低于3个样本时无法分析。
Q1:多组学关联分析与单组学研究相比有什么优势?
A1:1)能够系统描绘调控过程,增加数据的完整性;2)多组学数据之间可以进行相互验证,加强结论可信度;3)多组学数据联合分析更有利于生物学过程调控机制的研究,提高研究的创新性。
Q2:代谢组学和蛋白质组学/转录组学关联分析的生物功能联合分析包括哪些内容?
A2:基于通路的功能联合分析主要分为三块内容:1)蛋白/基因和代谢物共同注释到的通路;2)蛋白/基因和代谢物注释到的通路的重叠情况;3)在蛋白/基因和代谢水平上共同富集的通路分析。通过找到参与某条重要的代谢通路的差异蛋白/基因和差异代谢物或者分析蛋白/基因和代谢共同富集到的通路来界定生物学表型相关的关键通路。
Q3:关于代谢组学和蛋白质组学/转录组学整合分析有哪些思路?
A3:主要可以归为以下几类:1)分析蛋白质/基因和代谢物之间的相关性,通过单变量的两两相关或者通过多变量模型的相关性分析,界定表达相关性规律,通过聚类热图、相关性网络图以及和弦图从多个维度揭示表达调控规律;2)寻找蛋白/基因、代谢联合生物标志物:通过多组学模型界定对分组贡献最大的联合标志物组合,分析联合标志物组合对表型的预测效果;3)基于生物学通路整合蛋白组/基因,代谢组数据:找到参与某条重要的代谢通路的差异蛋白/基因和差异代谢物或者分析蛋白/基因和代谢共同富集到的通路来界定生物学表型相关的关键通路。