全球主机交流论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

IP归属甄别会员请立即修改密码
查看: 3321|回复: 13
打印 上一主题 下一主题

ARM服务器1

[复制链接]
跳转到指定楼层
1#
发表于 2013-3-15 18:05:19 | 只看该作者 回帖奖励 |正序浏览 |阅读模式
原文地址:http://news.mydrivers.com/1/257/257461.htm

称霸移动领域后,ARM试图进军并占领桌面、服务器早已经不是秘密,也有很多厂商行动起来,但从目前的迹象看,ARM服务器即便爆发最快也得等到2014年。虽然ARM架构在这几年各方面都堪称突飞猛进,但究竟能不能从Intel Xeon、AMD Opteron那里夺得一杯羹,还有待观察。

在目前已有的一些ARM服务器产品中,基本都是概念试验性质的,完全没有大规模铺开,因此想一探究竟也非常困难。又是大佬AnandTech,他们从英国Boston那里拿到了一台迄今为止堪称最为成熟的ARM服务器“Viridis”,其中使用了Calxeda专门为服务器开发的ARM SoC,并且和Intel Xeon、Atom进行了实际对比测试。

ARM服务器是骡子是马?终于第一次有了真正的评测数据。


这台服务器首先在外观上就很有特色,前面板赫然是红色的,在强调沉稳的服务器领域可不多见。Calxeda在这里用不同颜色来代表不同用途,红色对应云平台,橙色代表NAS应用,蓝色则是高性能集群。



注:原文中一些关于服务器零部件的介绍我们就特意略过了,重点只看处理器相关的。
前面板之后是24个2.5寸硬盘位,可以安装SATA硬盘,还有一个标准的750W 80PLUS金牌电源。
主板和普通x86服务器上的很不一样,没有任何CPU、内存插槽,而是遍布PCI-E插槽,每对插槽插上一个EnergyCard(简称EC)扩展卡,就构成了一个服务器集群。

每块EC上有4颗处理器、4条mimiDIMM内存插槽、16个SATA接口,相当于4个服务器节点。
每台服务器可以安装12块EC,那就是48个节点,不过光纤互连架构最多可以支持到4096个节点,具体多少就看怎么配置、需求几何了。

评测样机只有6块EC、24个节点。内存安装的是Netlist 4GB 1.35V ECC(PC3L-10600W-9-10-ZZ),总计24条、96GB。硬盘使用了三星MZ7PC256HAFU 256GB(类似消费级的310系列),每颗处理器对应一块,总计24块、6TB。以前的版本还有microSD卡插槽,现在取消了。
风冷散热方面做得倒是很巧妙,不过拆装起来有点费劲。

处理器名字叫做EnergyCore ECX-1000,台积电40nm工艺制造,Cortex-A9架构,四核心,主频1.1-1.4GHz,典型功耗3.8-5W。
每个核心有32KB一级指令、32KB一级数据缓存,所有核心共享4MB ECC二级缓存。普通移动处理器里一般只有1MB二级缓存,还不支持ECC。
处理器内还有优化SIMD处理的NEON扩展、独立的FPU浮点单元、TrustZone安全模块。Cortex-A9可以每时钟周期解码两条指令,并分发最多四条。这和双核心双线程的Atom差不多,但是跟Sandy Bridge Xeon E5的4-5条解码、6发射是没法比的。

真正的大杀器是功耗:Calxeda宣称,整个服务器节点在1.1GHz频率时的负载功耗最低只有5W,待机时更是区区0.5W。

服务器更离不开软件支持和优化。Calxeda在操作系统上支持Ubuntu、Fedora,不过理论上任何基于32-bit ARM Linux内核的编译版本都能够运行。Ubuntu ARM已经有了一个预编译的Hi**ank镜像可用。
Calxeda也在这方面投入了一些开发资源,并加入了非营利组织Linaro,旨在为ARM SoC打造开源生态系统。
截止去年底,Calxeda生态系统涵盖的操作系统、编译器、编程语言、调试器、Java、应用程序如下:

【理论性能测试】
本次测试参与对比的处理器包括:
Intel Atom 230:单核心双线程,主频1.6GHz,45nm工艺,热设计功耗4W。来自一台1U服务器,搭配内存4GB DDR2-667。
Intel Atom N450:单核心双线程,主频1.66GHz,45nm工艺,热设计功耗5.5W。来自华硕Eee PC上网本,搭配内存1GB DDR2-667。
Intel Atom N2800:双核心四线程,主频1.86GHz,32nm工艺,热设计功耗6.5W。来自Intel DN2800MT套装,搭配内存4GB DDR3-1333。
intel Xeon E5-2650L:Sandy Bridge-EP架构,八核心十六线程,主频1.8-2.3GHz,32nm,热设计功耗70W。来自Supermicro 2U服务器,双路(也就是16核心32线程),搭配内存64/128GB DDR3-1600。其实最佳对比对象应该是Atom S1200,Intel的首款微型服务器专用芯片,但暂时还找不到它,只好拿类似的Atom N2800顶替一下。

再重复一下ARM这边的配置:24颗ECX-1000 1.4GHz四核心处理器,24条Netlist 4GB DDR3-1333内存。
操作系统上,Xeon E5使用的是虚拟机VMware ESXi 5.1,其它都是Ubuntu 12.10。
下边开始测试。因为都是很专业性的东西,我们就不多加解释了,大家只要直观地看一下柱状图,了解谁高谁低、差距多少就醒了。

内存带宽测试:ARM虽然有四核心、DDR3-1333内存,但带宽少得可怜,还不如DDR2-667内存的Atom,更是只有单个Xeon的不到六分之一。

整数处理压缩测试:乱序执行的A9打败了顺序执行的Atom,但仅限四核心VS.单核心双线程,面对双核心四线程的Atom N2800还是略有不足,但也不错了,毕竟后者频率也更高。

整数处理解压测试:基本同上。顺便可以看出,超线程能够提升56%,第二个A9核心则能提升52%。
这两项综合显示,同频率下,四个A9核心基本上只相当于一个Xeon核心,后者如果开了超线程就需要六个A9核心才能匹配。

GCC编译:单线程性能略属于Atom,但六个A9核心才能比得上一个不开超线程的Xeon核心,而且别忘了Xeon还是运行在虚拟机里的。
14#
发表于 2013-3-15 23:06:39 | 只看该作者
好长
13#
 楼主| 发表于 2013-3-15 23:04:42 | 只看该作者
wdlth 发表于 2013-3-15 19:00
现在连编解码都上硬件了,ARM的软解那就是坑爹。

ip核硬件化早好多年就有这样的趋势了但软核的自由度非常高,就像“结束语”里提到因为灵活性可以专门定制某类型的硬件,
比方说 Google可以把youtu平台上的物理设备全换成定制的ARM 这种硬件可以在主板上集成一堆ARM做逻辑控制,
再集成一堆集成电路(ASIC)做基本运算,一台这样的设备做流媒体数据处理效率超过10台X86(实际效果可能还不止)
对于ARM来说,分类市场才是它的擅长之处。
12#
发表于 2013-3-15 19:08:26 | 只看该作者
弱爆了,  
11#
发表于 2013-3-15 19:06:50 | 只看该作者
妹子 ARM我就不说了
看到E5-2650L 不纯粹是虐ATOM么

点评

晚上有人陪吗,双蛋妹?  发表于 2013-3-15 23:05
10#
发表于 2013-3-15 19:00:18 | 只看该作者
xiasl 发表于 2013-3-15 18:22
ARM现在的定位更像是DSP芯片,所有功能全靠软件来实现,软件来模拟终究不靠谱。
或许会有人说X86不也是如 ...

现在连编解码都上硬件了,ARM的软解那就是坑爹。
9#
 楼主| 发表于 2013-3-15 18:22:54 | 只看该作者
wdlth 发表于 2013-3-15 18:10
ARM的指令集做大型运算就是杯具。

ARM现在的定位更像是DSP芯片,所有功能全靠软件来实现,软件来模拟终究不靠谱。
或许会有人说X86不也是如此么,为什么它的稳定性就要好很多呢?那是因为 Intel和AMD把最常用的指令全固化成逻辑电路了,
同时软件层做系统的都对此类硬件做了很长时间的优化,这点不是给源码就能搞定的。
8#
发表于 2013-3-15 18:13:05 | 只看该作者
test4
7#
发表于 2013-3-15 18:10:32 来自手机 | 只看该作者
ARM的指令集做大型运算就是杯具。
6#
发表于 2013-3-15 18:10:19 来自手机 | 只看该作者
test3
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|全球主机交流论坛

GMT+8, 2025-9-30 03:05 , Processed in 0.110495 second(s), 14 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表