1、附件 3:高性能计算集群采购需求1 刀片服务器机箱系统(2 箱)1.1 机型:高度5U,19 寸标准机架式刀片机箱1.2 刀片类型:支持10 个计算刀片,支持基于 Intel Xeon E5-2600 v3、v4 平台计算刀片供选择1.3 高速网络:每个刀片机箱支持 10Gb 以太网络,支持 56Gb FDR、100Gb EDR InfiniBand网络,每个机箱支持同时配置千兆以太网交换模块和 InfiniBand 交换模块1.4 刀箱交换模块:配置2 个千兆交换模块,每个交换模块对外提供6 个 RJ45 千兆电口,2 个 SPF+万兆端口1.5 电源:配置4 组高效热插拔冗余白金电源,电源
2、模块具有负载均衡和故障切换功能,支持提供 N+1 或 N+N 电源冗余1.6 风扇:配置5 个冗余风扇 1.7 刀箱管理模块:配置1 个 CMM 模块管理功能,可实现远程虚拟介质、远程 KVM、刀片状态、故障定位、开关机等全方位管理控制监视功能1.8 直通模块:每个刀箱配置10 个 56G FDR IB 直通子卡2 计算节点(数量 18 片)2.1 处理器:配置2 颗 Intel 至强 2680V4 或以上性能处理器2.2 内存:配置 8 根 16GB ECC DDR4 2133 内存,支持16 根内存插槽,最大可支持512GB 内存,支持内存保护、内存镜像、内存热备和内存热插拔2.3 硬盘:
3、 1 块 2.5 寸 300GB 10K 12Gb SAS 硬盘, ,最大可扩展2 个外置 2.5 寸热拔插硬盘槽位2.4 RAID 控制器:集成 LSI 3008 SAS 控制器,提供 RAID0/1/1E2.5 网卡:配置板载 2 个千兆以太网接口,全面支持虚拟化和 IO 加速3 GPU 服务器(数量 2 台)3.1 形态:2U 机架式服务器3.2 处理器:配置2 颗至强 2680V4 或以上性能处理器3.3 内存:配置8 根 16GB ECC DDR4 2133 内存,支持16 根内存插槽,支持 DDR4 2133/1866 ECC 内存,最大可扩展至 512GB RDDR4 内存3.4
4、 硬盘:配置1 块 2.5 寸 7200 转企业级 1TB SATA 硬盘,支持 8 块热插拔 2.5 寸 SAS/SATA 硬盘3.5 千兆网络接口:配置2 个千兆网络接口,支持网络唤醒,网络冗余,负载均衡等网络特性3.6 高速网络接口:配置1 块单口 56Gb/s FDR Infiniband HCA 卡3.7 加速卡:配置2 块 NV TESLA P100 16GB -E3x16 250W 双宽 GPU 卡,支持4 块GPU 加速卡3.8 PCIE :4 根 PCI-E 3.0 16,1 根 PCI-E 3.0 8 PCI-E 扩展槽为横插卡设计,支持全高扩展卡,可安装高性能 GPU3.
5、9 电源 :配置1600W 1+1 冗余电源4 集群存储(数量 1 台)4.1 形态:4U 机架式4.2 处理器:配置2 颗 Intel Xeon E5-2630 v4 及以上性能 CPU4.3 内存:配置8 根 16GB ECC DDR4 2133 内存,支持16 根内存插槽,支持 DDR4 2133/1866 ECC 内存,最大可扩展至 512GB RDDR4 内存4.4 硬盘:配置20 块 3.5 寸 7200 转企业级 4TB SAS 硬盘,支持 24 块热插拔 3.5 寸 SAS/SATA 硬盘4.5 千兆网络接口:配置2 个千兆网络接口,支持网络唤醒,网络冗余,负载均衡等网络特性4
6、.6 高速网络接口:配置1 块单口 56Gb/s FDR Infiniband HCA 卡4.7 电源 :配置1200W 1+1 冗余电源5 集群管理节点(数量 1 台)5.1 形态:2U 机架式服务器5.2 处理器:配置2 颗 Intel Xeon E5-2630 v4 及以上性能处理器5.3 内存:配置4 根 16GB ECC DDR4 2133 内存,最大支持24 个内存插槽,最大可支持内存,支持内存 ECC 保护、内存镜像、内存热备,支持 NVDIMM 内存可实现意外断电时内存数据不丢失5.4 硬盘:配置2 块 2.5 寸 10000 转企业级 300GB 12Gb SAS 硬盘,最大
7、支持8 个外置热拔插硬盘,支持 2 个 Nvme U.2 硬盘,支持4 个后置热插拔 2.5 寸硬盘位5.5 硬盘控制器:配置板载 SAS 卡,支持 RAID0/1/105.6 千兆网络接口:配置2 个千兆网口, 支持 NCSI、网络唤醒,网络冗余,负载均衡等网络高级特性5.7 高速网络接口:配置1 个单口 56 Gb/s FDR HCA 卡。5.8 I/O 插槽:最大支持 10 个 PCI-E 插槽5.9 电源:配置热插拔铂金 1+1 冗余电源,单个电源功率550W;支持 400W BBU 电池单元,提供二次备援功能5.10 配置 LCM 监控屏,可以显示服务器信息,CPU 温度、风扇转速、
8、当前使用功率等状态,管理接口 IP 地址,监控服务器工作状态,显示硬件故障报警,便于管理员快速找到故障部件,迅速排查故障,降低宕机损失5.11 管理:集成 BMC 芯片,支持 IPMI2.0 和 KVM Over IP 高级管理功能5.12 SD 卡:主板支持 SD 卡插槽,可实现存储 BMC 日志,存储的日志条数3 万条6 交换机(数量 1 台)6.1 端口数:48 个 10/100/1000M 自适应电接口,2*1G 光口(可升级 10G 光口)+ 2 个 10G SPF+ 光口上链和堆叠端口6.2 最大 MAC 地址数:16,0006.3 最大 VLAN 数:40966.4 最大 STP
9、:2536.5 最大路由数:IPV4 :12000,IPV6:10706.6 链路捆绑:每捆绑链路最大端口数:8,最大捆绑链路组数:1246.7 IPv6 支持:机功能管理,IPv6 硬件支持,IPv6 静态路由6.8 基本 3 层路由:IPv4 和 IPv6 静态路由,基于端口的接入控制列表,主机路由,虚拟接口,最多 255 个虚拟接口,路由接口,仅路由支持,IP 帮助,直接相连子网间的路由6.9 高级 3 层路由:OSPF v2,RIP v1/v2,虚拟路由器冗余协议( VRRP) ,VRRP-E ,GR6.10 高可用性:冗余外部电源,3 层 VRRP 协议冗余,整个堆栈中的实时状态同步
10、,从主堆栈控制器到备用堆栈控制器的平滑故障切换,受保护链路组,堆栈单元的热插拔7 IB 交换机(数量 1 台)7.1 56 Gb/s FDR Infiniband 高速交换机7.2 端口数不少于 36 口,并且需要满足整个集群系统的需求7.3 实现各节点到交换机端口实现全线速7.4 指示灯:每个端口均具具有体现端口状态的 LED 指示灯7.5 供电:冗余插槽,并且支持热插拔 7.6 冷却系统:从前到后或从后到前的冷却选项,可热插拔的风扇单元7.7 配置满足集群连接所需的 3 米 FDR IB 铜缆8 机柜(数量 2 台)8.1 42U 机柜一台8.2 32A 12 口 C19 、15 口 C1
11、3 PDU 2 个8.3 理线架 2 个9 集群综合管理系统(数量 1 套)9.1 品牌:商业版或服务器厂商原厂产品9.2 集群管理系统: 覆盖系统所有节点,界面必须实现完全中文化9.3 采用 B/S 架构,通过浏览器(IE,firefox 等)进行操作,可以管理集群系统中的软硬件资源和用户提交的作业9.4 支持按预定义或自定义的角色分组展现服务器状态信息,以及相关联的告警信息。9.5 支持热图方式集中展现集群中所有服务器的关键指标,如 CPU 利用率、内存利用率、网络可用性、电源状态、温度等,支持指标快速切换。9.6 提供灵活强大的集群配置能力,可以一键完成对整个集群的检测和配置,如检测网络
12、可用性、配置 ssh/rsh 无密码登陆、停止系统冗余服务、配置 NFS、同步集群时间、同步集群用户等。管理员可以灵活组合不同的配置项。9.7 支持针对集群整体(或者部分)进行各项指标(如 CPU、磁盘、内存等)的性能测评,图形化的结果展示测试结果9.8 支持通过机柜、服务器组或者节点名表达式选择服务器范围,支持对所选节点进行ssh/rsh 无密码设置,支持对设置过程中产生的输出进行实时监控。9.9 支持通过机柜、服务器组或者节点名表达式选择服务器范围,支持对所选节点进行时间同步,支持对同步过程中产生的输出进行实时监控。9.10 支持通过机柜、服务器组或者节点名表达式选择服务器范围,支持在所选
13、节点执行同一个命令,支持对命令执行过程中产生的输出进行实时监控。9.11 支持查询全集群所有节点的进程信息(如所属用户、进程名、父进程、所属节点、CPU利用率、进城合法性等) ,支持按照用户名、节点名、进程类型、进程号等条件进行组合查询。9.12 支持进程合法性的判定,支持基于节点、用户、进程等不同维度的白名单和黑名单设置,支持多维复合过滤条件设置,支持启动或者停止对残留作业进程、非法作业进程的自动清理操作。9.13 支持 NIS 服务器的创建、删除、修改,支持 NIS 客户端的自动配置。9.14 支持 NIS 和本地 passwd 用户管理(包括认证和增删改查) ,支持LDAP、AD,NIS
14、,Local 用户认证。9.15 提供消息管理功能,允许管理员查询或者删除平台使用过程中产生的各类通知消息,如作业通知消息、申请/审批消息、故障单提交/处理消息。9.16 提供本地软件仓库,集成 HPC 集群常用的各种开源和免费软件,包括集群基础软件(如编译器、MPI 数学库、Infiniband 驱动)和硬件诊断工具(如 hpl、stream、iozone) ,允许管理员或普通用户通过 Web 页面进行查询、安装或卸载软件。9.17 提供作业热图,直观展现用户作业在集群的分布情况,以及集群资源的整体使用状况。9.18 支持远程命令行提交和应用 Portal 作业提交。10 集群作业调度站(数
15、量 1 台)10.1 CPU: i7-7700T 10.2 内存 :8G 内存10.3 硬盘: 128G 固态硬盘,1T 普通硬盘10.4 显卡:GTX1060 独立显卡10.5 显示器:商用 27 寸显示器10.6 配套键盘鼠标11 机房装修11.1 根据实际场地情况,需要隔断出一个 30 平米左右的机房,建设机房环境必须满足计算机设备对温度、湿度和空气洁净度的要求,对供电电源的质量、接地电阻、电磁场和振动等技术要求,隔断墙需满足办公室隔音需求。11.2 新建机房中包括:隔断墙装修工程及系统集成;墙面粉刷乳胶漆;地面防静电地板;空调制冷系统一套。11.3 墙面及隔断工程设计:墙面装修对机房影
16、响极大,本机房墙面要求无论是基层还是面层均应采用防火材料,墙面要求板材强度高,防火及抗电磁干扰能力强,耐污染,易清洗,色调柔和无眩光,所有房间墙面均刮腻子刷乳胶漆。其中隔断采用隔音效果比较好的隔断墙设计。11.4 地面工程设计:(1)首先整理地面时采用地面找平并抹灰(2)在进行环氧树脂刷漆;(3)刷漆后晾干 3 天左右释放环氧树脂气味;(4)铺设地面保温材料;(5)铺设防静电地板,边缘处做踢脚线处理。11.5 空调系统:(1) 机柜散热需求:设备总功率约为 20KW,分摊到每个机柜大概 10KW,空调需要满足单个机柜至少 10KW 的散热需求。(2) 机房散热需求:维护结构传热根据机房面积核算,按每平米 110W 计,30 米需要3.3KW 散热需求。(3) 空调要求机房配置机房空调,空调系统提供24KW 的显冷量,按照匹数来算需要是少 5 匹的空调满足散热密度需求。
Copyright © 2018-2021 Wenke99.com All rights reserved
工信部备案号:浙ICP备20026746号-2
公安局备案号:浙公网安备33038302330469号
本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。