・Intel vs. AMD マルチコア対決!
・まえがき
今年2月に,Phoenicsクラスタの4台を入れ替えた.構成は以下のようなもの.
CPU : AMD Phenom 9500 2.2GHz
M/B : Elite A770M-A (AM2+)
Mem : DDR2-SDRAM DDR800 4GB
VGA : AOpen S72GS-DLP128X (nVidia GeForce 7300 SE/7200 GS)
筐体,HDDは流用したので比較的安価に仕上がった.お値段は4台で約35万.これで16コアの計算能力,16GBのメモリが手に入った.良い時代になったものです.
さて,いつものようにベンチマークをやってみよう.今回は余興として,昨年購入したDellのサーバーPrecision(Intel Xeon E5320の4×2=8コア機)に参加してもらった.Kakaku.comで調べると2008年4月1日現在の価格は以下の通り.
Intel Xeon E5320 | \29,380- |
AMD Phoenom 9500 | \20,880- |
どちらも購入当時はquad coreの最安値機種だったのだが,お約束通りAMDの方がお買い得.
・ベンチマーク種目
ベンチマークに使ったのは,例題V101のx,y,zのメッシュを倍に増やしたもの.Phoenics3.6.1導入テストで使ったものと同一だ.あれからPhoenicsもバージョンバージョンアップして2006になり,若干実効速度が変わっている.そこで,前回行ったベンチマークにおけるPentiumD 820のスコアを取りなおし,これを基準にしよう.
エントラント一覧
名前 | CPU | クロック | コア数/PC | 導入時期 |
Phoenics5,6 | AMD Phenom 9500 | 2.2GHz | 4 | 2008.02 |
Phoenics1-4 | Intel PentiumD 820 | 2.8GHz | 2 | 2007.09 |
Dell Precision | Intel Xeon E5320 | 1.86GHz | 8 | 2005.12 |
・計算結果
名前 | node数 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 |
Phoenics1-4(Ver3.6.1=参考データ) | 実行時間 [秒] |
417 | 217 | 178 | 162 | - | - | - | 116 |
Phoenics1-4 | 423 | 215 | 178 | 158 | 206 | × | 123 | 115 | |
Phoenics5,6 | 364 | 183 | 142 | 126 | 136 | × | 126 | 107 | |
Dell Precision | 328 | 185 | 145 | 124 | 110 | × | 99 | 93 |
※複数ノードでの計算は,なるべく同一PCでのノード数が多くなるように組み合わせた.
※6ノードでは何故か計算できない.
Xeon(青)とPhoenom(緑)の対決は,4ノードまでならほぼ互角,それ以降はPrecisionの圧勝となった.どちらも4コアCPUなので,パフォーマンスの差はノード間通信の速度が決めてであることが明らかだ.Xeon(青)の計算性能が苦しいながらもノード数につれて単調に増加しているのは,二つのCPU間が高速バスで結ばれているからで,Phoenomの場合は5ノード以上になると1000BaseのLANでの通信となる.LANがボトルネックとなる.これは2コアCPUであるPhoenics1-4(赤)結果を見ると明らか.Phoenics1-4の場合,5ノード,3台での計算速度は2ノード,1台の計算速度と変わらない.
見方を変えると,Xeonといえども4ノードと8ノードの相対性能比はたったの1.3倍.ほとんどが実馬力に繋がっていない.だったら,二つの独立したケースを同時に計算させた方がお得と言える.
・まとめ