logo

logo

技术平台

Technology platform

  • 首页GeneAn分析交付

GeneAn分析交付

a1

平台介绍

GeneAn是生物信息云计算混合云平台。实现生信数据交付和管理,支撑公司医学和科服业务运营,为各大测序服务商、研究机构等提供多组学大数据方面综合解决方案。

基于云的解决方案,可以实现海量基因数据的分析管理,通过多云治理、数据全生命周期管理、云资源自动化托管、多云部署、云监控及分析、安全合规及访问控制等维度,实现高效、稳定运作,满足业务、资源、成本的高度契合。


产品功能

  • 安全可扩展的基因数据分析平台,开箱即用。近乎无限的计算资源,海量存储空间,不需要额外硬件投入,可适应波动样本量。
  • 数据生命周期管理,让测序下机文件、分析结果文件的数据归档、删除有序进行,精细化运营存储。保证数据完全一致性下,无损压缩FASTQ格式文件,实现测序数据的高效存储及传输。
  • 分析加速,30 X人类全基因组数据分析使用通用硬件2小时,异构方案10分钟。注释过程加速,snp/indel单个WGS样本(500万位点) 8min。


产品亮点

  • 直观易用

图形化操作界面,覆盖分析、存储、交付全流程,一站式完成分析任务生产。在GeneAn可方便地查看、分析和共享数据,工具集提供多种流程,也可快速接入自己的分析流程。

  • 适用多种业务场景

已在全球投入使用,累计运行超过百万样本,对医学检测、科技服务各种不同类型业务具有完备的解决方案、支撑经验,技术成熟稳定。

  • 安全合规

云供应商基础设施结合GenanAn平台控制机制和认证合规性,支持临床合规标准,结果透明、可再现及可溯源。

  • 计算加速

现已研发出LUSH Aligner、LUSH QC、LUSH BQSR等加速组件,加速计算,同时保持高准确度。

  • 分布式计算引擎

针对基因大数据专门设计的分布式计算引擎,优化网络、存储、容器各方面,可应对万级别WGS样本分析。

  • 混合云

最大化利用本地资源,业务增长自动弹性上云,提升生产能力,灵活面对波动。


业务场景

一、大队列项目

  • 项目背景

大队列项目是大型基因组测序计划,透过基因数据加快基因组医学与临床应用、促进科学研究,了解区域内人群的遗传变异基因特征,长远而言可以提升市民的整体健康,作为特定群体基因组资源的描述用于全世界范围的研究。

  • 客户痛点

1. 数据量大

基因组项目的数据量巨大,一个人类30X 全基因组测序的下机文件就有100GB,大队列项目需要成千上万个这样的样本检测,数据量己超过PB级别。海量数据需要高度弹性、稳定可靠,高性能的分析系统、存储系统。

2. 数据管理难

项目到样时间零散,一个样本对应多个文件,不同维度的分析任务也会产生大量的中间文件、结果文件,样本还对应有庞杂的表型信息,海量的非结构化数据造成了数据管理的复杂度。加之数据量大,存储是一项巨大的开销。后续针对结果的特殊分析、统计,也需要准确组织所需要的文件。


  • 解决方案

① 规划整体IT解决方案:结合项目本地集群资源情况以及样本量情况,来规划整体IT解决方案。可提供本地集群,及混合云多方案来进行选择。保证数据安全隐私的同时,也可应对业务场景的样本波动。

② 使用了一系列解决方案来克服分析速度、大文件IO操作等性能瓶颈,大大缩短了处理时间,提高了后续分析的效率。使用自研分析引擎高效利用计算存储资源;使用加速版分析流程;针对FASTQ格式文件进行了无损压缩技术,在数据完全一致性下,实现测序数据的高效存储及传输...保证分析精度,提高分析效率,降低整体分析成本,控制项目的成本和完成进度。

③ 建立标准的流程和生信工具,便于不同队列之间的数据交换、交叉分析。

④ 数据管理系统对样本文件的全生命周期进行管理,记录数据出处等元数据,在需要指定样本分析时快速调取文件。

⑤ 提供可视化工具查看变异频率,快速检索,方便快速建立和探索队列。通过系统内置的Jupyter 可以快速组织复杂、交互式的队列数据分析。

⑥ 数据安全方面多管齐下,登录身份验证、角色权限控制、操作记录,使得系统上的一切均在监控和控制之下。网络隔离、数据库加密、数据传输加密,确保入组数据匿名且不外流,符合GDPR等安全管控规范。


二、药厂

  • 项目背景

基因测序作为推动精准医疗发展的一门技术,不仅应用在科研、临床领域,其对于药物的研发和筛选也同样具有重要的作用。因此各大药厂也采用基因测序手段开展各项工作。

  • 客户痛点

1)需要强大的分析工具分析数据量庞大而复杂的数据集。

2)需要符合生产合规性,例如GxP、GDPR。

  • 解决方案

① 依托华大基因十多年来上百项药物临床试验,多家国内外知名药企合作经验,GeneAn系统已运行药物靶点发现、药物临床试验分析方法(CTA)服务、伴随诊断合作开发等项目。

② 云提供弹性可扩展的资源,在降低成本保障数据安全的前提下,满足数据分析存储的需求。 

③ 允许在分析平台上传自定义的生信流程。

④ 完整的角色权限体系,可以更好的管理组织内部成员,分享数据。

⑤ 系统具备审计功能、行业领先的安全保障,有配合实验室申请资质的经验。


深圳华大科技(总部)

电话:400-706-6615
邮箱:info@genomics.cn

对话图标