n 慧算生物信息平臺整體解決方案
慧算生物為生命科學相關科研機構、基因測序公司等用戶提供專業的生物信息平臺的軟硬件一體化解決方案,目的是為客戶提供無憂后臺支撐,使科研工作者和相關公司聚焦其核心業務。
該整體解決方案,是為客戶提供定制化的軟硬件系統集成服務,既包括了服務器、存儲、網絡、文件系統、操作系統、集群管理軟件等IT基礎設施;也包括了全基因組、全外顯子、轉錄組等各種多樣化的生物信息數據分析流程的搭建;提供從軟件到硬件的全系統維護;提供在云端的“慧算生物信息云”服務;為復雜的高級定制數據分析提供外包服務;并依托“慧算生物信息學院”提供集中式或定制化培訓服務以及考試認證;另外,慧算還提供相關的知識庫、數據庫等。
n 高性能計算與海量存儲系統
應用場景一:測序儀配套高性能計算和存儲系統
針對Illumina 大型測序儀提供海量的并行文件存儲系統和適當規模的高性能計算系統。目前通量(雙流動槽)的一套測序系統三天一輪能產生約18T的堿基數據。
基因測序與分析一般包含三大階段:
階段一:Illumina 測序儀采集數據并經過處理后產生fastq格式原始文件;
階段二:Tophat/BWA/Bowtie等軟件讀取fastq格式文件及人類參考基因組索引,經過序列比對生成BAM格式文件;
階段三:GATK/samtools等軟件或其他基因分析類軟件如Manta/Varsand等基因結構變異檢測軟件、CNVnator基因拷貝數變異檢測軟件等讀取序列比對后的BAM文件,終進過分析處理生成VCF格式文件。
需要PB級的大規模橫向擴展能力和并行文件系統存儲設備,以及數十個高性能計算的節點。一方面滿足測序儀大量fastq文件存儲需求,另一方面滿足生物信息數據分析的計算資源和存儲資源需求。
應用場景二:De novo組裝分析
De novo組裝分析包括三個階段:
階段一:測序儀采集數據并經過處理后產生fastq格式原始文件;
階段二:對 fastq格式文件進行質量控制,并經過序列拼接生成contig/ scaffold拼接結果文件;
階段三:Glimmer等預測軟件對contig進行基因預測并對預測的基因進行功能注釋。
n 搭建生物信息分析流程
高通量測序數據金標準分析流程 + 定制化分析流程
l 預置三大類共九套高通量測序數據金標準分析流程,滿足絕大多數測序項目的分析需求
l 提供數據分析軟件及數據庫的定期維護和升級
l 提供生物信息人員遠程指導及到場培訓
l 提供特殊分析流程定制和布置服務
基因組工作流整合了一些分析軟件和相關生物信息學數據庫,把原始序列數據(fastq)處理為變型(VCF)數據。每個框表示一個分析模塊,由集成的基因組分析軟件組成,如數據質量控制、序列比對、變異提取和變異注釋分析等模塊。這些模塊自身可作為獨立工作流被使用,也可以按照邏輯關系被連接到一個更大的工作流中。
基因組工作流展示
高度集成各類生物學軟件及數據庫
*您想獲取產品的資料:
個人信息: