・Intel vs. AMD マルチコア対決!

・まえがき

 今年2月に,Phoenicsクラスタの4台を入れ替えた.構成は以下のようなもの.

CPU : AMD Phenom 9500 2.2GHz
M/B : Elite A770M-A (AM2+)
Mem : DDR2-SDRAM DDR800 4GB
VGA : AOpen S72GS-DLP128X (nVidia GeForce 7300 SE/7200 GS)

筐体,HDDは流用したので比較的安価に仕上がった.お値段は4台で約35万.これで16コアの計算能力,16GBのメモリが手に入った.良い時代になったものです.

さて,いつものようにベンチマークをやってみよう.今回は余興として,昨年購入したDellのサーバーPrecision(Intel Xeon E5320の4×2=8コア機)に参加してもらった.Kakaku.comで調べると2008年4月1日現在の価格は以下の通り.

Intel Xeon E5320 \29,380-
AMD Phoenom 9500 \20,880-

どちらも購入当時はquad coreの最安値機種だったのだが,お約束通りAMDの方がお買い得.

・ベンチマーク種目

 ベンチマークに使ったのは,例題V101のx,y,zのメッシュを倍に増やしたもの.Phoenics3.6.1導入テストで使ったものと同一だ.あれからPhoenicsもバージョンバージョンアップして2006になり,若干実効速度が変わっている.そこで,前回行ったベンチマークにおけるPentiumD 820のスコアを取りなおし,これを基準にしよう.

エントラント一覧

名前 CPU クロック コア数/PC 導入時期
Phoenics5,6 AMD Phenom 9500 2.2GHz 4 2008.02
Phoenics1-4 Intel PentiumD 820 2.8GHz 2 2007.09
Dell Precision Intel Xeon E5320 1.86GHz 8 2005.12

q1ファイル(Phoenics2006形式)

・計算結果

名前 node数 1 2 3 4 5 6 7 8
Phoenics1-4(Ver3.6.1=参考データ) 実行時間
[秒]
417 217 178 162 116
Phoenics1-4 423 215 178 158 206 × 123 115
Phoenics5,6 364 183 142 126 136 × 126 107
Dell Precision 328 185 145 124 110 × 99 93

※複数ノードでの計算は,なるべく同一PCでのノード数が多くなるように組み合わせた.
※6ノードでは何故か計算できない.

 Xeon(青)とPhoenom(緑)の対決は,4ノードまでならほぼ互角,それ以降はPrecisionの圧勝となった.どちらも4コアCPUなので,パフォーマンスの差はノード間通信の速度が決めてであることが明らかだ.Xeon(青)の計算性能が苦しいながらもノード数につれて単調に増加しているのは,二つのCPU間が高速バスで結ばれているからで,Phoenomの場合は5ノード以上になると1000BaseのLANでの通信となる.LANがボトルネックとなる.これは2コアCPUであるPhoenics1-4(赤)結果を見ると明らか.Phoenics1-4の場合,5ノード,3台での計算速度は2ノード,1台の計算速度と変わらない.

見方を変えると,Xeonといえども4ノードと8ノードの相対性能比はたったの1.3倍.ほとんどが実馬力に繋がっていない.だったら,二つの独立したケースを同時に計算させた方がお得と言える.

・まとめ