・デュアルコアがやってきた
先日のPhoenics3.6.1初期テストでCHAM Japanから耳よりな情報を聞いた.Parallel
PhoenicsはデュアルコアのCPUに対応していると言う.正確に言えば,Phoenics3.6.1が利用するMPICHがマルチCPUのマシンに対応していると言うことなのだが.
今年,パソコンの二大CPUサプライヤー,AMDとインテルが相次いでコンシューマー向けのデュアルコアCPUを発表した.これは,通常のCPUと見かけが同じでピン配置も互換だが,中には実質二つのCPUが入っており,普通のM/Bに装着しただけでデュアルCPUのマシンになってしまう,という素晴らしい物だ.
しかし,デュアルコアCPUに対するAMDとインテルの姿勢ははっきり異なり,AMDは既存CPUの最上位機種との位置づけ.値段も5万円からと,おいそれとは手が出せない.一方のインテルは,恐らく今後メインストリームのCPUを全てデュアルコアに入れ替えてしまうつもりなのだろう.価格設定は最下位の2.8GHz(Pentium
D 820)が3万円以下と,信じられないバーゲン価格.Pen4の2.8GHzが一つ当たり15,000円で買えてしまう計算だ.
本年度の卒業研究では二人にPhoenicsの計算をやらせるつもりなので,計算能力増強は急務だった.そこで,今回思い切って4nodeをPentium
D 820に入れ替えることにした.
ライセンス上,デュアルコアCPUがどのように取り扱われるのかは未だ問い合わせていないのでグレーゾーン.我々のライセンスは上限が「8CPUまで」となっている.しかし,8台のマシンにデュアルコアCPUを組み込むと16ノードまでの計算ができるようになるが,これがプロテクトされて実行できないか,実行できるがライセンス違反になるか,ということはわからない.今回のテストは,全て4台のマシン,8node以下の計算で行っている.
今回のレポートは,PhoenicsでデュアルコアCPUはどの程度有効に働くかをベンチマークテストで検証した結果である.興味ある点は,
といった点だ.
ベンチマークに使ったのは以下の構成のマシンたち.
名称 | マシン構成 |
Phoenics1-4(旧) | CPU : AthlonXP 1900+ (133x12.0) memory : DDR-266 512MB |
Phoenics1-4(新) | CPU : Pentium D 820 (2.8GHz) memory : DDR2-533 1024MB |
Phoenics8 | CPU : Pentium 4 2.8GHz (FSB533MHz) memory : DDR-266 512MB |
参考までに,4台のマシンのCPU,M/B,メモリーを交換するのにかかった費用は高々22万円程度.これで,最新スペックのデュアルCPUマシンが4台手に入る.信じられない.
ベンチマークに使ったのは,例題V101のx,y,zのメッシュを倍に増やしたもの.前回,Phoenics3.6.1導入テストで使ったものと同一だ.
・計算結果
構成 | node数 | 実行時間(秒) | 相対性能 |
Phoenics1(旧) | 1 | 691 | 1.00 |
Phoenics12(旧) | 2 | 354 | 1.95 |
Phoenics123(旧) | 3 | 251 | 2.76 |
Phoenics1234(旧) | 4 | 244 | 2.83 |
Phoenics1(新) | 1 | 417 | 1.66 |
Phoenics11(新) | 2 | 217 | 3.18 |
Phoenics12(新) | 2 | 218 | 3.17 |
Phoenics112(新) | 3 | 178 | 3.88 |
Phoenics123(新) | 3 | 181 | 3.82 |
Phoenics1122(新) | 4 | 162 | 4.27 |
Phoenics1234(新) | 4 | 170 | 4.06 |
Phoenics11223344(新) | 8 | 116 | 5.96 |
Phoenics8 | 1 | 475 | 1.45 |
※数字はノード番号.Phoenics11とは,Phoenics1の二つのコアで計算した,と言う意味.
はじめに,Pentium4 2.8GHzとPentiumD 820を比較してみる.性能比は1 : 1.14と,デュアルコアに軍配が上がった.これは,CPUクロックが同一でも新Phoenics1-4はメモリーが高速なのでその差が出たものと思われる.したがって,デュアルコアCPUのコアあたり性能はシングルコアのPentium
4と変わらないと判断できる.
続いて,デュアルコアを使ってnode数を増やしていった場合と,デュアルコアを使わず,4台で4nodeとしたばあいの性能を比較してみる.ここが今回のベンチマークの最も重要なポイントだ.結果はグラフの赤,緑の様に,デュアルコア使用の方が性能が僅かに高い,と言う結果になった.これは以下の二つの事を示唆している.
最後に,今回の更新で,[nodeあたり性能1.5倍]x[node数2倍]=3倍 の性能向上を目論んだのだが,旧Phoenics1-4に対して新Phoenics1-4の8nodeの計算能力は 244/116=2.10倍 と,やや期待を下回る結果となった.node数を二倍に増やしても性能が二倍になるわけではないということだ.ちなみに,新Phoenicsの4nodeと8nodeの性能比は1.46.この結果から,お金があったらCPUの数を増やすより,nodeあたり性能を追求した方が得,ということがわかる.
・まとめ