生物信息学:服务器案例
2024-04-28
需求分析
生物信息学利用应用数学、信息学、统计学和计算机科学的方法研究生物学的问题。生物信息学利用数学工具从大量数据中提取有用的生物学信息,其研究工具是计算机,研究方法包括对生物学数据的搜索(收集和筛选)、处理(编辑、整理、管理和显示)及利用(计算、模拟)。目前主要的研究方向有:序列比对、基因识别、基因重组、蛋白质结构预测、基因表达、蛋白质反应的预测,以及建立进化模型。
BLAST和FASTA是目前使用得最为频繁的两套数据库搜索程序。它们的功能相近,都是把用户提交的一个核酸序列或蛋白质序列拿去与指定的数据库中的全部序列作比较。一般认为,BLAST运行速度快,对蛋白质序列的搜寻更为有效,目前已有并行版本,支持集群的计算;FASTA运行较慢,对核酸序列更为敏感。也有基于网页交互的软件如STING,用于结构生物信息学的分析。
首先,对于生物信息学领域高性能计算应用而言,计算能力当然是首要的需求。其次,在计算过程中,大部分生物信息学应用会进行大量的内存访问,对内存的容量和访问速度都有很高的需求,特别是基因测序中对内存的需求比其它类型的计算都要大。最后,生物信息学一般数据量非常巨大,需要高速的硬盘读写中间数据,以及大容量存储来存放数据。
解决方案
机器外观方面,元素魔方计算生物信息学服务器分为静音塔式服务器和机架式服务器两种,适应客户办公室和机房不同的使用场景。
机器硬件方面,元素魔方计算生物信息学服务器既有基于Intel Xeon CPU平台方案,又有基于AMD EPYC CPU平台方案,具有支持单路CPU、双路CPU、四路CPU等多种机型,以及以这些机型为基础构建的高性能计算集群方案,可以满足科研人员多层次需求。元素魔方计算生物信息学服务器支持高达48根内存通道,可以满足用户对内存带宽的要求,和内存容量的要求。元素魔方计算生物信息学服务器支持高达2个2260、2280、22110 M.2 SSD硬盘位,高达4个2.5英寸热插拔U.2 SSD硬盘位,支持高达12块3.5英寸热插拔SATA/SAS硬盘位,可以满足用户对硬盘读写速度的要求,和存储容量的要求。
机器软件方面,元素魔方计算生物信息学服务器出厂预装Blast,GATK,BWA,Bowtie2等常用或者客户指定的计算生物信息学软件,集成OpenMPI, MPICH并行计算环境,GNU C/C++编译器,GNU Fortran编译器,LAPACK, BLAS, Atlas, FFTW等高性能计算函数库,安装CentOS,Ubuntu等多种操作系统,部署机器管理系统和作业调度系统软件。
方案价值
元素魔方计算生物信息学服务器分为静音塔式服务器和机架式服务器两种,静音塔式服务器可以放置在办公室像台式机一样使用,机架式服务器可以放置在机房远程使用,用户使用起来非常方便。
元素魔方计算生物信息学服务器,分为Intel平台方案和AMD平台方案。基于Intel Xeon CPU平台方案最大支持四路CPU,CPU核心高达112个,最大支持48根内存通道,内存容量高达12TB。基于AMD EPYC CPU平台方案最大支持双路CPU,CPU核心高达128个,最大支持32根内存通道,内存容量高达8TB。CPU计算能力强劲,内存带宽和容量都非常大,可以加快完成客户的计算生物信息学任务。最大支持4个U.2 SSD固态硬盘,容量高达32TB,每块SSD读写速度高达2000MB/s,读写速度是普通机械硬盘的十几倍,较大提升中间数据的读写速度,从而提升计算速度。最大支持12块3.5英寸机械硬盘,容量高达240TB,方便在本地存储海量的生物信息数据。
元素魔方计算生物信息学服务器,出厂预装计算生物信息学软件、并行计算环境、编译器、高性能计算函数库、操作系统,真正做到了交钥匙工程,用户开箱即用。部署机器管理系统软件,可以监控服务器CPU、内存、硬盘、网络等组件的配置情况,负载情况,以及健康状况,以便用户更好地管理和维护服务器。部署作业调度系统软件,可以创建管理员账户和若干普通用户账户,账户权限设定,提交多个作业时,支持作业状态监控,排队,优先,删除等管理功能。
以下为适合生物信息学的服务器配置表,可参考:
如果您有其他需求,我们专业老师也会为您量需定制,欢迎添加肖老师详细咨询【17621920434】