初版2010/10/1
改訂2010/10/3
 
SC'90報告
小柳義夫(当時、筑波大学)
 
http://olab.is.s.u-tokyo.ac.jp/~oyanagi/reports/SC1990.htmlにあります。
http://olab.is.s.u-tokyo.ac.jp/~oyanagi/conf.html にはその他の国際会議の報告などがありますので、興味があればご笑覧ください。
 
 最近書棚の奥から手書きの古いメモが出てきましたので、20年前のことですが、記録として皆様に提示します。ご笑覧ください。[]内は現在のわたくしのコメントです。
 
 第3回のSupercomputer Conferenceは、ニューヨークのロックフェラーセンターのヒルトンホテルで、1990年11月12日〜16日に開かれた。気温の上下が激しく、暖かい日があるかと思うと、隣のホテルまでも歩きたくないような寒風の吹きすさぶ日もあった。
 
 基調講演としては10月にテラフロップスを狙うCM-5を発表して意気の上がっていたTMC (Thinking Machine Corporation)のDaniel Hillisが「最速のコンピュータ」と題して講演した。その概要を不完全なメモから記す。
 
 いつの時代にも、最先端の機械技術は人々の関心をそそる。[これは殺し文句のはずであったが、マイクの調子が悪くて繰り返すことになり、せっかくの名文句が台無しになった]古代では、土地測量技術や天文学であり、一七、八世紀には機械時計とレンズ磨きであった。また一八世紀後半には蒸気機関が登場した。そして二〇世紀は情報機械の時代である。
 
1.古い常識への挑戦
 CM-2は常識に反して高い性能を出している。例えばオブジェクト認識は、64 KProcessorのCM-2で1.5 GFlopsが出た。数値処理では地球物理の問題で1.2 GF出た。水中の音響問題での陰解法で1.25 GFでた。主要部は三重対角解法である。有限要素法は不規則な通信が必要になるが、宇宙ステーションの構造問題を8 KProcessorで○[不明]が出た。
 非局所的な計算では、流体の渦糸法で多体問題に変更し、14 k vorticesの系を64 KProcessorで解いて5.2 GFが出た。
 動的な通信パターンの問題でも、LANLの気候モデルのFree Lagrange codeも64 KProcessorで動くし、NCARのスペクトル法も動く。浅水コードでは、XMP4では0.5 GFしか出ないが、CM-2では1.8GFも出る。レーダー合成[開口合成レーダー?]は、54K×54K の行列を処理するが、32KProcessorのCM-2で2.15GFを出した。負荷バランスが重要な問題でも、量子モンテカルロ計算が64 KProcessorのCM-2で1.5 GFでできる。
 Amdahl's Law によれば並列度が上がるにつれ効率は落ちるとされているが、それは問題が固定されているからで、並列度とともに問題も大きくすればスケールすることが期待される。
 結論として、超並列処理は有効だということだ。
 
2.超並列への遷移
 1995年には超並列がIT技術の中心になるであろう。コストと性能との関係が重要。標準Fortranも77から90になり、ベクトル計算機向きになった。今後は超並列向きの言語が重要になるであろう。スーパーコンピュータの収入は減少しつつある。ベクトルから超並列への転換は始まっている。
 
3.将来
 RP3 (IBM)やCMなど、現在いろいろな研究が行われているが、アーキテクチャは収束しつつある。それは、ハードウェア的には分散しているが、ソフトウェア的には単一アドレス空間であることである。その方がプログラムが容易である。結局SIMDとMIMDの混合となるであろう。SIMDはプログラムが容易で[本当か?]、MIMDは条件分岐のあるプログラムが速い。新しいフロンティアが開けている。
 1995年のCMはどうなっているであろうか。それはソフトウェアとしては今とコンパティブルであろう。速度は1 TF、メモリは1 TB、I/Oは1 Tb/sとなるであろう。[実際には、1995年を待つことなく、1993年8月にTMCは連邦破産法第11条を申請し破産していた。何という皮肉であろう。社員はSun Microsystemsなどに移った。]
 
 Proceedingsによると日本からの論文発表は、以下の5件であった。
 
1) A linear array of processors with partially shared memory for parallel solution of PDE
Okawa, Y. Haraguchi, N. 
Page(s): 41 - 48
 
2) A parallel object-oriented total architecture: A-NET
Baba, T. Yoshinaga, T. Iijima, T. Iwamoto, Y. Hamada, M. Suzuki, M. 
Page(s): 276 - 285
 
3) Monte Carlo simulation of the Ising model and random number generation on the vector processor
Ito, N. Kanada, Y. 
Page(s): 753 - 763
 
4) Parallel processing of near fine grain tasks using static scheduling on OSCAR (optimally scheduled advanced multiprocessor)
Kasahara, H. Honda, H. Narita, S. 
Page(s): 856 - 864
 
5) A network-topology independent task allocation strategy for parallel computers
Baba, T. Iwamoto, Y. Yoshinaga, T. 
Page(s): 878 - 887
 
 20年前のことなのでほとんど記憶はないが、終了後市内のCBSテレビ局の見学に行ったことを覚えている。大きなスタジオでは、サイモンとガーファンクルがリハーサルをやっていた。