初版 2002/12/ 5 改訂 2003/ 1/10 SC2002報告 小柳義夫 http://olab.is.s.u-tokyo.ac.jp/~oyanagi/reports/SC2002 (再配布は自由ですが、上記ページから最新版をご利用ください。) 一々記しませんが、多くの方から訂正や追加情報をいただき感謝い   たしております。できるだけ取り入れてよいレポートにしたいと思   います。A4用紙でしたら11ptでプリントしてください。 これまでのSCや他の会議についての報告が下記にあります。 http://olab.is.s.u-tokyo.ac.jp/~oyanagi/conf.html 1.はじめに SC2002: International Conference on High Performance Networking and Computing (通称 Supercomputing 2002。主催はIEEE Computer SocietyとACM SIGARC) は、15回目の今年、"FROM TERABYTES TO INSIGHTS"(テラバイトから 洞察へ)の表題のもとで、メリーランド州ボルチモアのBaltimore Convention Center で11月18日から23日まで開催された(educational program やtutorial は16日から)。 昨年9月11日の同時多発テロの記憶は多少薄れたものの、イラクへの攻撃が 刻一刻と迫り、あいかわらずただならない雰囲気である。近くでライフル銃に よる無差別射撃事件が起こり肝を冷やしていたが、直前に犯人が逮捕されひと まず安心した。 ボルチモアはワシントンDCの近郊の歴史的な町で、1623年にチャールズ1世 が第2代ボルチモア卿に領土を分け与えたことに始まるという。1729年、新た に港町として生まれ変わり、水運の要地として反映してきた。国際会議場はか つての繁栄の面影を残すInner Harborの一角に位置している。気温は、最低0 度、最高10度ちょっと(いずれも摂氏)といったところで、東京の普通の冬程 度。昼間はコートを着ない人も見られた。 2.歴史 この会議はアメリカの東西で交互に開かれて来た。参加者等のデータを示す。 年次、開催都市、展示・チュートリアル等を含めた総参加者数、technical program有料登録者数、総展示数、投稿論文数、採択数、採択率を示す。 (thanks to Dr. Al Brenner) 今年の出席者数は初日の月曜日で5200を越えて いるという発表があり、木曜日にはなんと7200人という最高記録を達成したこ とが報告された。詳細はわかり次第追加の予定。 total tech. exh. sub. acc. rate 1st(1988) Orlando 1495 36 150 60 40% 2nd(1989) Reno 1926 47 ? 88 3rd(1990) New York 2303 59 ? 92 4th(1991) Albuquerque 4442 80 215 83 39% 5th(1992) Minneapolis 4636 82 220 75 34% 6th(1993) Portland 5196 106 300 72 24% 7th(1994) Washington 5822 2209 122 ? 77 8th(1995) San Diego 5772 2017 106 241 69 29% 9th(1996) Pittsburgh 4682 1642 121 143 54 38% 10th(1997) San Jose 5436 1837 126 334 57 17% 11th(1998) Orlando 5750 1984 130 270 54 20% 12th(1999) Portland 5100 2124 149 223 65 29% 13th(2000) Dallas 5051 2096 159 179 62 35% 14th(2001) Denver 5277 2017 155 240 60 25% 15th(2002) Baltimore 7200+ 2192 221 67 私は、第1回、第4回、第12回には出席できなかった。 ちなみに、来年は 16th 2003年 Phoenix, Arizona (November 17-21) である。 3.全体像 昨年はテロの影響もあって、日本からの参加者は例年より若干少なかった感 じがしたが、今年はずいぶん回復した。全体では上記のように空前の参加者、 総展示数となった。 会議は、Education Programが16日(土)から、チュートリアル(32件、全日 は18件、半日は14件)は17日(日)から始まった。Education Programも年々盛 んになっている。 これらを別にすれば、12日(月)夜7時の展示会場における Gala Openings (盛大な開会式)から会議の中心部分が始まる。このとき展示会場が公開されそ の場で飲み物(参加者は2杯まで無料)と軽食が提供される。 火曜日の朝から実質的なプログラムが始まる。朝は8:30からで結構つらい。 今回はホテルと会場とが近いと言うことで貸し切りバスの運転はなかった。火 水木の8:30--10:00はplenaryで、基調講演や招待講演(4件)に当てられている。 10時からはコーヒーブレークで、結構ボリュームのあるパンや果物なども出て、 朝食の代わりにする人も多い。展示会場も10時からオープン。10:30から17:00 まではいろいろなプログラムが多数並列に設定されている。今年も、審査付き の原著講演(30分)と並列に、Masterworksと称して、さまざまな分野の総合報 告が招待講演(45分)として設けられていた。金曜は展示もなく、早めに帰って しまう人も多いので、6つのパネルが3並列で行われた。 今年の大きなテーマは3月に稼働開始した日本の地球シミュレータ(横浜) であった。なにしろ Top500 において久々の1位を取り戻したばかりか、昨年 の1位の5倍の性能であった。佐藤哲也センター長が plenary の招待講演を行 い、Gordon Bell 賞のうち3件を地球シミュレータ関係の論文が取得した。基 調講演でも、招待講演でも、地球シミュレータの名前が何度も言及された。最 終日には、「40 TFlop/sの地球シミュレータシステムがこれからのスーパーコ ンピュータ開発に与えるインパクト」というパネルがもたれた。ASCI Purple, Blue Gene, Blue Planet などの対抗プロジェクトもいろいろ計画されている。 アメリカとしては、予算獲得の格好のネタだったようだ。 ASCI Purple (ASCIの最終システム) 100 TF をIBMが受注したことが会場で 記者発表された。これかASCIのRed Storm (Crayが受注したOpteronのクラスタ) のいずれかが地球シミュレータを破ることになろう。Crayは同時に、X1という 50 TFを実現するベクトルMPPを発表し大いに気炎を上げていた。Gridについて もいろいろあったが、去年のようなブームというより、むしろ常識となったよ うだ。 4.Social Events 恒例により木曜日の夜はConference Reception。今年は、Inner Harborに ある水族館であった。これもバスでなく、三々五々徒歩で出かけた。 他にいくつかの企業がお客様を招待するパーティーがあった。ほとんど火曜 日で(これも恒例になってしまった)、HPがRennaissance Harbour Place Hotelで、SGIが会場の隣のSheraton Hotelで、CrayはMarriot Hotelで開いた。 他にもあったかもしれない。IBMは例によって港の中にあるScience Centerと いう子供向きの科学博物館を借り切って大きなパーティーを開いていた。場所 の雰囲気に重点を置く会社、料理に凝る会社、人の交わりを最大のもてなし考 える会社などさまざまであった。 5.企業展示 主催者発表によると、今年は122の企業展示(昨年の27%増)があった。この うち46社は新顔とのことである。分類は難しいが、いわゆるベンダが12、ネッ トワークが17、ストレージが14、クラスタが12、ソフト(Grid middleware、 言語、OSを含む)18、出版5などである。ストレージやネットワークについて は、ベンダも含めてかなりの力の入れようであった。 目についたところでは、IBMがASCI Purpleの受注やBlue Gene/Lで盛り上がっ ていた。サーバとしても、新たにRegatta p655を発表した。詳しくは後の記事 参照。 Crayは、SV2として開発されていた超並列ベクトル機X1を発表した。詳しく は後の記事参照。 SGIは少し前にItanium 2 baseのOrigin3900を発表して意気が上がっていた。 これはOrigin 3000ファミリの最上位で、従来の4倍の高密度実装を実現した。 Sun Mycrosystemsは、Sun Fire 6800/12000/15000を結合する高速のFire Link(Wildcatというコードネームで開発されていたものらしい)を発表した。 スイッチを使えば最大8台まで接続できる。新しいサーバの発表はなかった。 NECは地球シミュレータで開発した技術によりベクトル計算機SX-6/SX-7を販 売している。Itanium 2のサーバも出している。 富士通は、これまでのVPPシリーズに変えてSparcアーキテクチャに基づくチッ プを用いたPrimePowerを出した。今後、Top500でどの位置を占めるか期待され る。また、InfiniBandに基づくクラスタ接続装置を展示していた。今の Myrinetと同等以上のバンド幅やlatencyを実現しているとのことである。 日立は、SR8000シリーズを宣伝していたが、正面にroad mapを掲げ、次期機 種をほのめかしていた。 Intelは一時InfiniBandの開発に腰が引けているとの噂もあったが、これを うち消すようにLANLに業界最大(dual Xeonのノード128台)のInfiniBandクラ スタを構築したと発表した。 AMDはx86の64bit版ともいうべきOpteronを開発中であったが、今回1.5 GHz の石を展示した。某AMD fanによると、「指で触ったら冷たかった!」Opteron は来年前半に出荷が予定されている。アメリカのRed Stormに使われる予定。 6.研究展示 今年は99の研究展示(Research Exhibits)が出展された。日本からは11件、 Japan Grid Cluster Federation (産総研グリッド研究センター、筑波大計算 物理学研究センター、eHPC project、PC Cluster Consorcium、東工大などの 連合体。筆者も筑波大学の客員として末席を汚していた。)、大阪大学サイバー メディアセンター、同志社大学、地球シミュレータセンター、東北大学流体研、 原子力研究所計算科学技術推進センター、航空技術研究所、高度情報科学技術 研究機構(RIST)、理化学研究所、埼玉大学連合、東京大学データレザボアプロ ジェクト(後の 21-3 4) Bandwidth Challengeの項参照)である。昨年はテロ 直後で出展をあきらめたところもあったが、今年は盛況であった。 アジア関係やいくつかのアメリカの展示がPacific Rim としてひとまとめに (それにしてはUniv. of HoustonやCornellなどもあったが)Zone 1に置かれ たが、それがSCinetの大きな機械の壁で本会場から隔てられ、人の流れが少な かった。昨年に続く不当な取り扱いでみんなで怒りまくった。担当者が来年は ちゃんとすると弁明していた。なお、航空技術研究所の廣瀬直喜氏は研究展示 の委員であった。来年のことをよろしく。 7.Technical papers 本来、学術的に一番大事なのは投稿ベースの67件のtechnical papers(原著 論文)である。今年の投稿数はまだ不明だが、冒頭の表にあるように採択率は 例年かなり低く、難関である。 今年のプログラム委員会には日本から、松岡聡(東工大)、三浦謙一(富士 通)、関口智嗣(産総研)、田中良夫(産総研)が加わった。 分野としては、応用7、性能予測6、グリッド6、ネットワーク6、data 6、コ ンパイラ・ランタイム6、可視化3、ミドルウェア3、web service 3、メッセー ジパシング3、スケジューリング3、数値計算3、アーキテクチャ3、system component 3、Gordon Bell 6である。これらの論文はCD-ROMで配られたほか、 SC2002のホームページ http://www.sc-2002.org/program_tech.html から全文のpdf-filesがリンクされている。 日本からの論文は、Gordon Bell賞関係4件の他は "Data Reservoir: Utilization of Multi-Gigabit Backbone Network for Data-Intensive Research" Kei Hiraki (U Tokyo) et al. であった。21日のBandwidth Challengeに関連記事あり。あと、 "Collaborative Simulation Grid: Multiscale Quantum-Mechanical/Classical Atomistic Simulations on Distributed PC Clusters in the US and Japan" Hideaki Kikuchi (Louisiana State U) et al. が日米混成チーム。 ======19日火曜日====== 19−1 開会式 前日のGala Openingに引き続いて、19日(火曜日)の8:30から開会式があっ た。開会前にビデオが流れ地球シミュレータを含む世界のス−パーコンセンター が紹介された。まず組織委員長の Prof. Roscoe Giles (Boston University) が全体報告をおこなった。月曜までの参加者は36カ国、5200人を越え、空前の 規模になるかも知れない、と誇らしげに報告した。今年の新しい試みは IntelliBadgeという電波による追跡システムで、どの会場に何人いるかがreal timeでわかるんだそうだ。「まあ、トイレは別だが」と笑いを取っていた。今 回は希望者だけだが早くも売り切れてしまったようだ。さすがもの好きが多い。 技術不信のわたしなどまっぴらごめん。 会場のネットワークSCinetはますます増強され、外とはOC192 (10 Gb/s)が 4本、場内のコアは170Gb/sにも及ぶ。無線LANは、802.11bを全フロアに、 802.11a (54 Mb/s)を展示スペースに張っている。 来年はアリゾナ州Phoenix(フェニックス)で、11月15日〜21日、標語は "IGNITING INNOVATION"(技術革新に火を付けよう)、ロゴはfirebird(火の 鳥)でご当地の(Pasqua) Yaqui Indian(ヤキ族)の神話に出てくる鳥とか。デ ザインはDavid Moreno(有名な芸術家。聞き間違いでなければ)。今年はなかっ たが、SCGlobal2001に続いて世界に広げるSCGlobal2003をやるということであ る。今年も、plenary sessionはInternet Broadcastで放送されたが、日本で 見ていた人の話では画像も音声も全然だめだったそうだ。 19−2 Keynote Address 今回の基調講演は、NSF DirectorのDr. Rita Colwellの"Computing: Getting us on the path to wisdom"であった。彼女はbiotechnologyの出身で、 第11代のNSF Director (1998/8/4より)である。まず、エマーソンの「wisdom とは、日常性の中に奇跡的なものを見い出すこと"to see miraculous in the common"である」という言葉を引用して、歴史的な話から現在までのNSFの戦略 を語った。 1960年代は計算センタの時代であった。1970年代は....。1980年代はスーパー コンピューティングとネットワークの時代であった。1990年代は...。今はテ ラスケールの時代である。NSFが推進しているTeraGridは、integrated facilityであるところに特徴がある。今や21世紀においては、どの分野にも cyberinfrastructureが必要である。Gridとスーパーコンピューティングは今 後中心的な役割を果たすであろう。これによって、"From Terabyte to Insight"(この会議の標語)が実現するのである。人間の複雑性を理解するに は、ロバストかつ柔軟で総合的なcyberinfrastructureが必要である。NSFは程 なくcyberinfrastructureの必要性に関する最終報告を発表する予定である。 まずNSFが進めているTeraGrid計画は、合衆国のすべての研究者が使える最 も進んだ計算施設である。これによって広い領域の研究者が、知的な発見のた めの、高性能な計算、広帯域のネットワーク、大容量のデータ貯蔵、高度なツー ルにアクセスできるようになる。 いくつかの分野を取り上げた。まず物理学と天文学はスーパーコンピュータ の利益を受けている。いまや、SloanのDigital Sky Surveyによってだれでも データを見ることができる。ブラックホールの衝突と重力波の放出というよう な複雑なシミュレーションを行うこともできる。膨大なデータを扱うために、 アメリカとヨーロッパで共同してGriPhyNプロジェクトが進められている。 2006年にはペタバイトになるであろう。地震工学のシミュレーションのために NEESGridが進められている。これは、21世紀型のの研究協力であり、壁も時計 もないバーチャルな研究室である。このプロジェクトは地震の破壊力をを理解 し、損害を最小にするような建築法や素材の開発を可能にする。彼女はここで 地球シミュレータにも言及した。また、EarthScopeという分散観測所はGPSな どによる4000点の観測網により北米大陸の地震と火山の活動を監視し、そのデー タはNEESに供給される。これは全く新しい発見の地平を開くのである。また、 GEONという地球科学のネットワークもある。 生命科学もコンピュータの利益を受けている重要な分野である。Celera Genomicsによれば、ヒトゲノム計画では何兆個ものシークエンスの比較が必要 であり、これは高度な計算インフラストラクチャがなければ到底実現できなかっ たであろう。これまでは遺伝子のsequencingが問題であったが、今後はタンパ ク質の折れ曲がりが重要な課題である。かつては20ヶ月もかかったが、テラフ ロップスの計算機があれば1日でできるであろう。しかしそれだけではない。 地上には千万ないし一億の種が存在しているが、知られているのは170万種程 度であり、そのうち5万しか詳しく調べられていない。生物の多様性保護のた めにNEONという活動もある。海洋も重要。彼女の専門らしく線虫(elegans)の 話もした。また、鳥の鳴き声の分析から人間の声の理解にも役立つであろう。 ロバストなcyberinfrastructureは浄水の危機、伝染病、気候変動、本土安 全保障などの新しい問題にも貢献する。現代の重要問題はいかに落とし穴を避 け、科学技術の持つ可能性を把握するかと言うことである。 これまで科学はreductionism(還元主義)で、要素の基本法則を理解するこ とに力を注いできたが、今後はシミュレーションによるintegration(統合) も重要になり、両者の協力が必要になるであろう。 スーパーコンピューティングは人類をwisdom(叡智)に導くのである。 cyberinfrastructureというキーワードが耳に残った。 19−3 Cray X1 1日目(19日火曜日)の15:30からのMasterworksはSteve Scott (Cray)によ る"The Cray X1"であった。X1はこれまでSV2というコードネームで開発されて きたもので、去る14日に正式発表された。Scott氏によると、X1はXMP, YMP, C90, T90, SV1のPVP (parallel vector processor)の路線と、T3D, T3EのMPP (massively parallel processor)の二つの路線を統合したものであり、両者の 長所を兼ね備えている。あわせて、10年のroad mapを示し、我が社こそ2010年 までにペタフロップスの実効性能を実現すると豪語した。 氏は、"The Cray X1 is NOT your father's vector machine."と強調した。 主たる違いは、命令セットアーキテクチャが新しいこと(32 64-word vector registers and 64 scalar registers, all operable under mask. 64 and 32 bit IEEE arithmetic)、システムアーキテクチャが新しいこと、マイクロアー キテクチャも新しいことを挙げた。特に、X1はdecoupled microarchtechture を持ち、短いベクトルに有効であると強調した(スカラパイプラインのような ものか?)。 ノードは4プロセッサから成る。プロセッサは2本のパイプから成る演算器が 4個で構成され、12.8 GFの性能を持つている(パイプがmultiply&addだとする と1.25 nsのクロックか?)。この4個は同期され、8本のパイプとも見えるし、 2本のパイプが4種あるとも見える。各演算器はそれぞれ「キャッシュ」を持っ ているというのでびっくりした。システム全体はccNUMAであり、1024 nodesま で拡張可能、つまり最大52.4 TF。one cabinetには16 nodesまで収容でき、 819 GF。最大構成は64キャビネットということか。キャビネット間は2次元トー ラスで結合する。その結合網のバンド幅はどのくらいであろうか。 スケーラビリティはT3Eの遺産である、と氏は強調した。decoupled microarchtectureを再び強調した。Cache coherenceはdirectory-baseで、3 方向のupdateをnsで実行できる。 OSはUNICOS/mpであり、single system imageを実現する。I/O subsystemは PCIXでfiber channelを用いる。OpenMPもMPIも利用できる。 機械的には、裸のチップに冷媒を直接吹き付けて気化熱で冷却する新技術を 開発した。展示のCray社のブースでは、実物を展示してあった。ここまでやる か!! 性能についても、Ocean Modelでの例を示した(内容は聞き取れず)。 すでにAHPCRC (米国陸軍HPC研究センター)や、スペイン気象研究所など5カ 所から受注し、さらに注文を期待している。ORNLには評価のため32プロセッサ のシステムが設置されている。 19−4 IBMのHPC路線 1日目(19日火曜日)16:30からIBMの Exhibitors's Forumがあった。この日 の1時に会場でASCI PurpleとBlue Gene/Lに関する重大発表をしたばかりであ り、かなりの人数が集まった。講演はHPC担当副社長 Peter Ungaro氏。 氏は歴史から説き起こし、93年6月の最初のTop500にはIBMのマシンが一つも なかったことを指摘した。Power 4の卓越性について強調し、Celera社も sequencingの時にはAlphaを使っていたが、proteomics(タンパク質の解析) に移ってからはp690 (Regatta)を12台買ったと述べた。 このたび新しいRegatta p655を発表した。これはPower 4を最大8-wayに組む ことができる。ただし、4-wayでは1.3 GHzになるが、8-wayでは1.1 GHzしかで ない。one rackに最大128 cpuを収容でき563 GFの性能を出せる。Aixでも Linuxでも動く。 IBMはクラスタでもがんばっている。Blade Centerは、高密度パッケージで、 2.8 GHzのdual Xeon のブレードを7Uに14枚収容できる。 グリッドについても力を入れている。deep computing, autonomous computing, on-demand computing、これがIBMのグリッドのコンセプトだ。ア メリカのTeraGridや、イギリスのeScience Gridを手がけている。 最後にASCI Purpleについて簡単に触れた。これは次世代チップPower 5 (8 GF)を64-wayのSMPに組んだものを単位とし、これを200台ほど接続したもの である。このような大規模なSMPではメモリシステムの改良が不可欠であると 強調した。Blue Gene/Lについても簡単に触れた。 ======20日水曜日====== 20−1 招待講演「先端的計算と科学的発見」エネルギー省科学局長R. オーバッ ク博士 2日目(20日水曜日)の8:30からは全体会議で二つの講演があった。最初が Raymond L. Orbach (Director of the DOE Office of Science) の "High End Computation and Scientific Discovery"である。Dr. Orbachは物理学の専門 で、2002年3月に第14代の科学局長に就任した。それまではUC Riversideの学 長。科学局の2002会計年度の予算は$3.3B(4000億円)で、高エネルギー物理、 核物理、基礎エネルギー科学、磁気核融合、生物・環境科学、計算科学などを 支援する。物理科学の43%を支援している。アメリカにおける基礎科学のスポ ンサーとしては3番目の大きさである。博士は以下のような講演を行った。 [講演記録が手に入ったので、中身をかいつまんで示す.] 超大規模科学計算(Ultra-Scale scientific computation)は、実験、理論に 並ぶ科学研究の第3の柱である。シミュレーションは、直接計算できないよう な複雑な系に対する自然法則への洞察を与える。そのために高度な実効性能が 必要とされるので、計算に対する新しい社会学が生まれる。つまり単に現存の コンピュータシステムを規模拡大するのではなく、計算に対する共通の利害を もつコミュニティが、応用数学者、コンピュータ科学者、チップや結合網の製 造者などとともに集まって、コンピュータを科学的な必要性に合わせて設計し 直すのである。そのためには大規模計算システムのかなりの割合が必要になる。 科学的な利益は発見への約束から生じるが、商業的な利益はvirtual prototypeの必要から生じる。どちらにせよ、計算機利用への要求は増大し、 大規模計算施設に対する維持可能な市場が生まれるのである。 エネルギー省科学局は数学ソフトウェアの開発を支援してきた。1970年代始 め以来、科学局の支援によりEISPACKやLINPACKやLAPACKなどが開発された。多 くの階層からなるメモリを持つシステムでの効率を高めるためにBLASが開発さ れた。DOEの援助のもとにPVMやMPIやGlobal Arraysが開発され、重要な標準と なった。さらに我々のSciDAC program (Scientific Discovery through Advanced Computing)を述べなくてはならない。これは現在年間$60Mが予算化 されている。我々は計算科学のコミュニティと協力して科学の発展のために働 く覚悟である。 21世紀に入って科学発見のツールが変わった。これまでは実験と理論が2 本の柱であったが、いわゆる超大規模(Ultra-Scale)計算の到来により、科学 的研究に対する3本目の柱が加わった。現代の計算技術の発達は急速であり、 コンピュータ・シミュレーションの寿王政は実験や理論に匹敵するものとなっ た。このような施設のすばらしい能力は科学技術への新しい視野を開いた。 科学的発見はしばしば反直観的であり、従来の知恵に反している。たとえば、 宇宙の膨張が加速しているという発見がある。われわれはその理論的起源を知 らない。アインシュタインは定常宇宙を実現するために宇宙項を導入したが、 ハッブルが宇宙膨張を観測したのでそれを無視した。 私の科学者としてのキャリアのなかでもコンピュータは進歩した。私が最初 に論文のために使ったIBM701はガチャガチャ動いていたが、現在のMPPはフッ トボール場サイズの部屋を占拠し小さな町くらいの電力と空調を用いている。 このような計算機の驚くべきスピード、特に横浜の地球シミュレータによる 超大規模計算が自然科学、やがては社会科学、人文科学へのアプローチを変え るであろう。かつてはとてもできなかった世界の探求を行うことができる。か つては、あまりに複雑で解析的に解けない物理法則の方程式をコンピュータに よって解いていた。いまでは、予測できないシステムの物理法則を発見するこ とができる。数百、数千、数百万のアクターが複雑に相互作用するような物理 的あるいは社会的な構造をモデル化することもできる。新しい計算環境のスピー ドにより、多くの異なるアクター間の、あるいは個体間の関係をテストし、ど んなマクロの振る舞いをするかを見ることができる。シミュレーションは、基 本的な「力」あるいはアクター間の相互作用の性質を決定することができる。 こうして計算機シミュレーションはそれ自身発見の主要な力となった。この 進歩の多くはMPPの発展によって可能になった。今日お話しする科学的なシミュ レーションのすべてはこのタイプの計算機で実現したものである。MPP計算機 はデスクトップやサーバー市場設計されたシステムを相互結合するという戦略 により設計されたものである、ある種の応用には効率的である。しかし、科学 局が重要視する多くの問題には非効率である。つまりある問題では実効速度が 60%であるが、他の問題では10%にもならない。シミュレーションによる発見の ためには、50-100TFの実効性能が必要である。ある種の応用に対しては今日ア メリカのコンピュータは2TFを実現するが、他の大多数の応用に対しては10分 の1以下なのである。 これに比べて、今年の4月に発表された地球シミュレータでは、計算流体力 学に対して12TFを実現し、地球科学では26TFを実現した。この違いの結果は気 候モデルにおいて顕著である。 米国で可能な最良のスケールは100 km x 100 km であるが、この長さでは山 もハリケーンも海岸線も平均化されてしまう。複雑系では、入力の詳しい性質 によって結果が大きく変わることが知られている。もしそれらが平均化されて しまうなら、長期間予報などできるであろうか。地球シミュレータは10 km x 10 km のグリッドで気候モデルを計算できる。地球シミュレータの佐藤センター 長は最近エネルギー省で行った講演において、台風が生成する様子をシミュレー ションによって示し、このモデルの長期予測に対する信頼性を確信させた。 気候システムとともに重要なのが、「自己着火と、火炎なしの燃焼の制御」 である。自己点火は火炎もスパークもなく熱だけで燃料混合物が着火する過程 である。たとえば、トラックのディーゼルエンジンのシリンダーで起こってい る。また自己着火は多くの自動車エンジンの効率を制限し[ノッキングのこと か]、発電に用いられているガスタービンの望まないフラッシュバックを引き 起こす。問題は、混合ガスの揺らぎのなかで自己着火がどのように展開するか ということと、これをどう制御したらいいかと言うことである。現在の理解は、 実験データや0次元または1次元のシミュレーションに基づく予備的なもので ある。ほとんどの研究は、空間的変化のない混合ガスを仮定しているのである。 図に示した2次元数値シミュレーションは計算資源によって制限さえている。 3次元をやるには3x10^18演算が必要である、100TFのコンピュータでも10時間 掛かる。コードの効率を上げ(現在のS3DコードはNERSCの計算機では7%しか出 ない)、より適したコンピュータアーキテクチャを用いれば、40-50TFの計算 機でも合理的な時間で計算できるであろう。 3つ目は超新星である。超新星を目印に宇宙の大きさと年齢と膨張速度を測 定することができる。ビッグバン以来超新星爆発以上のものはない。数秒間の 間に10^30メガトン/秒以上のエネルギーがニュートリノで放出され、同様の エネルギーの光も放出される。このような爆発によって、中性子星やブラック ホールが生成される。過去10年間、Ia型の超新星は標準光源の役を果たして きた。これから推定した距離により、宇宙の膨張が現在加速しているという驚 くべき事実が発見された。超新星は本質的に多次元であり、対流、流体力学的 不安定性、放射移送が中心的な役割を果たす。最近の観測では、放出される物 質には大きな球対称からの破れがあり、3次元星の重要性を示している。熱平 衡から通り状態のシステムからのニュートリノと光の移送は、爆発機構にも超 新星の診断にも重要である。しかし、現在の超新星のコンピュータシミュレー ションは2つの空間次元において行われている。これから重要な物理を維持し つつ3次元に進むには、少なくとも2桁の計算速度の増大が必要である。現在、 コアの崩壊の2次元モデルは、ニュートリノの移送を単純化しても10^15の演 算が必要である。物理の複雑性を増すと、2桁計算量が増え、3次元を加える と500倍の計算が日宇町になる。これは10^20回の浮動小数演算であり、10-20 TFの実効速度でも1.5ヶ月掛かる。計算だけでなく、I/Oの量と速度、メモリバ ンド幅、プロセッサ通信速度、特にメモリとI/Oのlatencyの改良が必要である。 このような計算機によって初めてコンピュータ上で超新星の爆発が可能になる のである。 わたしは超大規模計算が本質的である3つの例をお話ししてきた。これ以外 にも多くの例があり、http://www.ultrasim.info/doe_docs/ にあるバーチャ ル・ワークショップのを見ていただきたい。同様のNSFのワークショップ "Computation As a Tool for Discovery in Physics"が http://www.nsf.gov/pubs/2002/nsf02176/start.htm にもある。 先端的計算(high-end computation)の市場は科学だけでなく応用にも広がっ ている。超大規模計算機は商業的な市場も持っている。産業への科学技術の重 要性は、何億ドルにもおよぶ大きな機会を提供している。たとえばGM (General Motors)は、自動車の設計開発のために3.5TFにも及ぶ計算能力を自 社内に持っている。これにより、クラッシュのシミュレーション、安全モデル、 空気力学、熱および燃焼の解析、新材料の研究などを行っている。計算は、プ ロトタイピングとそのための材料のコストの削減に大きく貢献している。しか し、安全基準が高度化し、燃料効率の増大が求められ、軽く強い素材が必要と されているので、計算能力も30%ないし50%の年率で増大している。これは現存 のアーキテクチャや技術では対応できない。もし100TFの計算機ができたら、 設計、開発、マーケティングなどに何億ドルもの市場効果をもたらすであろう。 複雑な系をモデル化し、分析し、検証する能力は製品設計にとって決定的な 要素である。今日ではHPCに基づく設計開発技術をを活用して、電力システム や航空機エンジンから医療画像技術まで製造している。このような予測モデル で実行したいことの多くは現世代の計算能力では実現不可能である。モデルの 忠実性を増大させるにはHPCシステムの性能をかなり増大させなければならな い。GE(General Electric)としては、世界市場での競争力を保つために製造 ラインでの計算能力をてこ入れすることが決定的な重要性をもつ。HPC技術と それを可能にするインフラでのリーダーシップは、GEにとって重要である。 一例として、GEのジェットエンジンのシミュレーションとプロトタイピング の間の評価を見てみよう。ジェットエンジンの最適化のためには3.1x10^18回 の演算が必要である。つまり、10TFの実効性能で3.6日かかる。もちおろん、 100TFの実効性能ならばたった8.6時間である。これは、物理的なプロトタイピ ングの設計のたえの数億ドルと数年の期間と比較するべきである。 製薬、石油やガスの探査、航空機設計などの分野にも多くの可能性がある。 50-100TF領域の実効性能のために必要とされる機械の大きさと複雑さを考える と、先端的計算の社会学はたぶん変わらないであろう。超大規模計算の利用は、 現在の放射光装置の利用に似たものになるであろう。大きな機械を設置し、多 くのユーザグループが共同して利用することになろう。われわれのSciDACプロ グラムの指導力により、学際的なチームとその協力者は、テラスケールのコン ピュータを有効に利用して基礎科学を進歩させるために、必要な最新の数学ア ルゴリズムとソフトウェアを開発するであろう。このようなチームは、相互に 関心のある問題の数学的インフラに応じて集まり、コンピュータのアーキテク チャに合ったソフトを作るであろう。 巨大なデータ量、高い実効スピード、そして価格のために、計算パワーは数 カ所に集中し、ネットワークによって通信とデータ処理を行うであろう。ただ し、テラスケールスピードのコアの計算にネットワークを使うことはないであ ろう。提案はピアレビューによって評価されマシンタイムが与えられる。放射 光の時と同様、産業界の参加も歓迎される。チームはユーザグループを結成し、 それぞれの計算の要求の性質に従って計算機の全部または一部を使用する。超 大規模計算への投資を正当化できるような大きなサイズの問題を解くのである から、大きなブロック単位で時間を割り振ることになろう。 可視化にも新しいパラダイムが必要になる。このことは、天文学や核融合を 考えれば理解できるであろう。われわれの天体物理学のバーチャルワークショッ プグループ、Julian Borrill, Peter Nugent, John Shalf, Martin White, and Stan Woosleyは、John Hules編集の本の中で、「計算天体物理は、理論と 観測との接点を与える本質的な役割を担っている。複雑なシミュレーションに よって可能になった詳しい理論的な予言から、新しい観測の大変な解析によっ て得られる詳しい参照点まで、新千年期の天体物理学の発展は我々が利用でき る計算能力によって決まる。」 ドイツ・ポツダムのAlbert-Einstein-InstituteのDr. Ed Seidelは、同じ質 量のブラックホールの衝突から生まれる重力波を科学局のNERSC(LBNL)の計算 機を総計200万時間(前マシンを13日間使ったことに相当)使って計算した。 これは数年後に観測に掛かるかもしれない。ブラックホールの衝突は、最初に 見つかる重力波のソースと考えられている。この計算により、ブラックホール が予想よりかなり早く合体することが示された。このような計算は、LIGO, GEO, VIRGO, LISAなどの観測装置のデータを分析するために必要不可欠である。 DOEにとって核融合ほど重要なものはない。SciDACの援助のもと2001年に5つ のプロジェクトが発足している。これによりUSの融合科学は大きく発展するで あろう。このような計算能力は我が国の商業的に利用可能な核融合エネルギー を現実的な時間のうちに実現するという国家目標にとって本質的に重要である。 プリンストンのプラズマ物理研究所のWonchull Parkは、プラズマの不安定性 をシミュレーションで実証することに成功した。彼は次世代のより高温度のプ ラズマの生成のために、再結合が重要であることをしめした。ある条件の下で、 この現象は他のモードと結合して崩壊に至ることを示した。この過程をよく理 解すれば、磁気核融合を実用に一歩近づけることができる。(ビデオを示す) このシミュレーションは実際より高い温度で行われているが、これを現実の状 況で行うには100倍の計算パワーが必要である。 これまで示したビデオによって、超大規模計算のもたらす興奮を皆さんに感 じていただけたと思う。今回天体物理学と核融合に焦点を当てたが、計算とシ ミュレーションは科学のすべての分野に発見を促す。DOE科学局は科学の全ス ペクトルにわたる発見のために必要なアルゴリズムとアーキテクチャを開発し ている。私は、超大規模計算によって得られる機会が、真にすばらしいものと なることを信じている。 20−2 「宇宙を計算する:ビッグバンからブラックホールまで」 引き続き、Julian Borrill (Lawrence Berkeley National Laboratory)の "Computing the Cosmos: From Big Bang to Black Holes"という計算宇宙物理 に関する招待講演が行われた。宇宙物理のデータ解析とシミュレーションにお いて、もし100 TFが手には入ったら何ができるかを示そう。 宇宙は大きく複雑である。宇宙の歴史を考えると、初期宇宙は場の理論が関 係する、10^-10秒の世界である。30万年経って温度は3000Kに下がり、中性化 した。現在はそれが3Kまで下がっている。その揺らぎは、3Kの中のμKの揺ら ぎであり、データ解析的にも大変難しい。結局銀河の形成を考えると10^50も のダイナミックレンジが必要なのである。その計算量は膨大である。 超新星の爆発と殻の崩壊、ニュートリノの放出は複雑な過程である。また、 ブラックホールの連星が重力波を放出して合体する現象は大変面白い。(その ビデオを示した。Orbachも同じようなビデオを見せた)LIGOやLISAなどという 重力波の観測が進められているが、観測データを解釈するにもシミュレーショ ンが必要である。 計算機によるシミュレーションは仮想天文台だ。しかしそれにはPeta-scale の計算が必要である。 天文学においても、実験、理論、計算の結合が重要なのである。 20−3 Gordon Bell I Digital Equipmentの副社長であったGordon Bell氏(現在たしかマイクロソ フト)が毎年ポケットマネー5000ドルを出して与えられる賞で、「並列処理に おいて実際問題の計算を行い、応用で最高の性能を出した人」に与えられる。 実際にはいくつかのカテゴリーから選ばれ、賞金は分割される。今回は38件の 応募があったそうであるが、選考委員会(委員長Tom Stirling)は6件までに 絞り込んだ。 20日13:30はそのうち3件のfinalistsの研究発表があった。 --29.5 TFlops Simulation of Planetesimals in Uranus-Neptune Region on GRAPE-6 J. Makino (U Tokyo) et al. --SALINAS: A scalable software for High-Performance Structural and Solid Mechanics Simulations M. Bhardwaj (SNL) et al. --NAMD: Biomolecular Simulation on Thousands of Processors J. C. Phillips (UIUC) et al. 牧野淳一郎氏は、これまでGordon Bell賞を5回も受賞しており、今回受賞 すれば6回目。SALINASの話はASCI関係で、ASCI Red (2940 processors)で 292.5 GF、ASCI White (3375 processors)で1.16 TFを出したというもの。 NAMDは、バイオ分子のための分子動力学コードで、PSCのAlpha Cluster上で O(N log N)のEwaldシミュレーションをおこなったというもの。 20−4 Top 500 BoF いつもの通り20日(水曜日)BoF (Birds of a Feather) の一つとして、Top 500 の会があった。Hans Meuer, J. Dongarra, E. Strohmeier, H. Simonなど が主催。今年は1993年6月に最初のTop500が発表されて以来ちょうど10年にな るので、10年間の総括なども行われた。このBoFのスライドはすでに公表され ている。 http://phase.hpcc.jp/mirrors/top500/lists/2002/11/bof.html まず、今年の発表があった。webには先週の13日頃から掲載されている。昨 年と同様に表彰状を作り、Horst Simonが上位3位にこの場で授与した。もち ろん1位は佐藤センター長が受け取った。2位と3位は、 ASCI Qの1/3の片割れ が二つ(一つがunclassifiedで、一つがclassifiedだそうだ)なので、マネー ジャーの何とかさんが受け取った。 栄枯盛衰が厳しいのはいつものことではあるが、今回はTop10のうち6つが新 しいシステムである。2位3位を取ったASCI Qの一部、5位のLLNLのLinux PC Cluster with Quadrix switch、8位のFSL/NOAAのHPTi/Myrinet clusterであ る。Top10にPCクラスタが入ったのは初めてである。あと、IBM Power4 system が2つ、9位のUK HPCx Consortiumとと10位のNCARである。ついに日本のマシン は、地球シミュレータを除いてTop20から撤退した。アメリカはものすごい勢 いでHPCを増強している。2番目は26位の東大情報基盤センターのSR8000/MPP である。 トップの性能のリストは階段状になっている。NWTやASCI RedやASCI White は何回かのリストに続けて載っている。これを外挿すると、2005年にはTF以上 ないとTop500には載らないと思われる。現在はTF以上のシステムは47しかない が。それから、2009年にはPetaFlop systemが登場すると予想される。 Stromaierが10年間のトレンドを示した。ベクトルからスカラーへの変化、 でも今でもベクトルは性能的にはかなりの部分を背負っている。チップ別のグ ラフも示した。Intelのチップは、i860がParagonで活躍していたが次第に廃れ、 近年クラスタの隆盛とともに復活している。アーキテクチャでは、すでに clusterとconstellation が半分を占めている。クラスタのTop20のうち、7つ がアメリカ、8つが中国である(本当か? 未確認)。 続いてDongarraがベンチマークとしてのLINPACKについてコメントした。 LINPACKがベンチマークになったのはほんの偶然であった。最初のレポートを 出したのが1977年であるから、今年はちょうど25年目である。このレポートで は、NCARのCray-1が14 MFを出したのが最高であった。LINPACK benchmarkには 3種類あり、100x100でプログラムの変更を許さない版、1000x1000でbest effortを許すHPPと、任意のサイズのTPPである。100x100は時代遅れではある が、25年間全く同一の基準で性能を測ってきたという歴史的な意義はある。 ピーク性能との比を効率と呼ぶことにすると、100%近いのから、10%程度の ものまでいろいろある。しかし、LINPACKベンチマークは計算機のある性能を 測定するものであり、全能力を測っているわけではない。 続いて、Pfreundt (iPACS)氏が、"New and Alternative Benchmark"と題し て、新しいベンチマークの可能性について述べた。何でLINPACKなんぞで順位 付けをするのだというような批判に答えるためであろう。特にLINPACKが連続 アクセスを特徴としているので、data access patternで分類したらというよ うな案を提案した。すなわち、templral localityの指標であるreuse of data、 ベクトル長やメッセージ長を示すgranuality、spacial locality/strideを示 すregulairtyで特徴付けようということらしいが、具体案が示されたわけでは ない。われわれがかねてから主張しているように、ベンチマークには様々な階 層があり、それぞれの特徴を持っているが、ではLINPACKに代われるかという と結局難しい。 最後にHorst Simon とErich Strohmaier(NERSC)が10年間の総括を兼ねて "The Most Powerful Supercomputers 1993-2002"という分析を紹介した。つま り、トップの計算機がある時点でどのくらいぬきんでていたかを、500番目ま でのRmaxの和との比(相対Rmax)で示そうということで、各システムについて20 枚の表での合計を計算した。相対Rmaxの総計の意味でもっとも抜きんでた計算 機を3つ挙げよ、というクイズがあり、それらしい答えをしていた正解者は来 年6月のISC2003の参加がただになったらしい。10位まで示す。 1) ASCI Red (SNL) 49.0% Max Rank 1 2) Numerical Wind Tunnel(NAL) 41.2% 1 3) Earth Simulator 28.4% 1 4) Paragon XP/S140 (SNL) 26.9% 1 5) ASCI White (LLNL) 23.6% 1 6) CM-5 (LANL) 19.8% 1 7) ASCI Blue Mountain (LANL) 17.9% 2 8) cp-pacs (U. Tsukuba) 16.1% 1 9) ASCI Blue Pacific (LLNL) 15.2% 2 10) CM-5 (Minnesota SC) 13.7% 2 である(秘密のマシンは除いた)。合計なので、長く優位を保つと有利になる。 前回のASCI Whiteを7倍も凌駕した地球シミュレータが意外に低いのはそのせ いであろう。ASCI Redは前回のトップだったcp-pacsを3倍も凌駕し、しかも 長く1位を保った。NWTも3年間(6枚の表)でトップまたは2位にいたからすご い。 各システムについて、合計でなく、最大の相対Rmaxについても表が示され、 これではさすがに地球シミュレータが1位であった。 1) Earth Simulator 16.2% 2) NWT (NAL) 8.5% 3) ASCI Red 8.3% 4) ASCI White 6.7% 5) XP/S140 (SNL) 6.4% 6) CM-5 (LANL) 5.3% 7) cp-pacs 4.6% 8) ASCI Blue Pacific 4.2% 9) ASCI Blue Mountain 4.1% 10) T3E (Government) 3.9% ついでに、合計相対Rmaxで何処が一番強いセンターかというと、 1) SNL 83.8% 2) LANL 74.8% 3) LLNL 59.3% 4) NAL 46.2% 5) U Tokyo 33.9% 6) PSC 28.5% 7) Earth Simulator Center 28.4% 8) NERSC 27.1% 9) ORNL 27.0% 10) NASA/Ames 23.7% ということである。 ======21日木曜日====== 21−1 地球シミュレータ 3日目(21日木曜日)のplenaryの招待講演の最初は佐藤哲也氏の"The Earth Simulator"であった。場所、機械、応用、運営などにわたって話された が、利用時間の25〜30%が所長留め置きで国際協力に使うんだ、というあたり で会場が沸いた。 21−2 HPCの医療への応用 続く招待講演はRon Kikinis, M.D. (Harvard Medical School)の"High Performance Computing for Image Guided Therapy" であり、脳腫瘍の手術な どを例にHPCがいかに活躍しているかを述べた。医学用語がたくさん出てきて 十分には理解できていない。 昔の医者は外側しか見なかったが、IGT(イメージ誘導治療)とは、ボリュー ムレンダリングの技術を用いて身体の内部を3次元的に再構成し、その情報を 用いて手術を行うことである。しかも手術前に画像を撮るだけでなく、手術の 中でオンラインに画像データを取り、時々刻々修正していく必要がある。その ためのメモリの要求は極めて膨大である。昔IBMのThomas J. Watson, Jr. が 「計算機なんて世界に数台あればいい」と言ったという話は有名であるが、計 算機の性能への要求は止まるところを知らない。 話の重点は、手術の進行とともに脳の各部分がどのように移動し変形するか ということで、そのためdiffusion tensorをMRIによって測定し、表示する技 術が重要である。目で見ただけでは分からない変形も、diffusion tensorの固 有ベクトルのマップを作ると腫瘍まで分かるそうである。EM-MRF Segmentationが重要と言っていたが何のことだか理解できず。 使っている計算機はSunFire6800 (24 x 750MHz UltraSparcIII)だそうであ る。疎行列の並列解法にはPETScを用いている。将来、TeraGridが利用できる ようになれば、もっと改良されたbiomechanical modelを用いて手術をするこ とができるようになる。 興味のある方は、The Surgical Planning Lab (Harvard)のホームページ http://www.spl.harvard.edu/ および、3D Slicerソフトのホームページ http://www.slicer.org/ を参照してくださいとのこと。 21−3 Awards 恒例により木曜日の1:30から各種の賞の発表と授与式があった。筆者はちょ うど1時半からJGCFのブースで発表することになっていたので、30分ほど遅れ て出席した。人に聞いたりしたので、情報が一部未確認であるのであしからず。 1) The Sidney Fernbach Memorial Award HPCの応用分野の大家である故Sidney Fernbach (LLNL)氏を記念して、革新 的なアプローチを用いて応用分野に顕著な貢献をした人に与えられる。これは IEEEの正式な賞で、1992から始まった。賞金$2000。過去の受賞者は、 ○1993 David H. Bailey (アルゴリズム) ○1994 Charles Peskin (血流のシミュレーション) ○1995 Paul Woodward (流体およびその可視化) ○1996 Gary A. Glatzmaier(地球の磁気力学のシミュレーション) ○1997 Charbel Farhat (機械工学の並列ソフトウェア) ○1998 Phillip Colella (流体力学、衝撃波) ○1999 Michael Norman (宇宙物理) ○2000 Stephen W. Attaway(?) なお、昨年は受賞者がいなかった。今年の委員長はJack Dongarra、委員は Al Brenner, David Bailey, Charbel Farhat, Mike Normanである。Fernbach 賞はRobert J. Harrison (Pacific Northwest National Laboratory, 計算化 学)に与えられた。Harrison氏は、2002年1月につくばで開かれた「ハイパフォー マンスコンピューティングと計算科学シンポジウム」において、招待講演"A Multidisciplinary Approach to Computational Chemistry" をしていただい た。 2) The Seymour Cray Computer Science and Engineering Award これもIEEEの正式な賞で、賞金はなんと$10,000 (確かスポンサーはSGI。は じめは SGI の Cray Division)。これはSeymour Crayを記念して1997年に作 られた賞で、Seymour Crayが示したような創造的精神を実証するHPCシステム への顕著な寄与をした人に贈られる。今年の委員長はJohn Riganati氏、委員 はTor Bloch, Vito Bongiorno, Dona Crawford, Dennis Duke, Ken Neves, Yoshio Oyanagi。どういうわけか筆者も末席を汚していた。 これまでの受賞者は、 ○1999 John Cocke (RISCの発明者) ○2000 Glen J. Culler (VLIWの発明者、David Culler のお父さんとのこと) ○2001 John Hennessy (ccNUMAの発明者) 審査の経過は開示できないが、Monty M. Denneau博士(IBM)に決まった。彼 は、IBMの並列処理開発(TF1/Vulcan, GF 11, IBM-SP series, Blue Gene, The Wiring Machine, Yorktown Simulation Engineなど)において一貫して指導的 立場にあった人である。日本の何人かの人が、地球シミュレータをはじめ多く の科学技術高速計算機製作の指導的立場にあった故三好甫氏を推薦したが、こ の賞は原則として存命者に贈られるとのことである。 授賞式のあと恒例により講演を行ったが、あまりテクニカルな話はしなかった。 3) Gordon Bell賞 実際的に使用されている大規模なプログラムで最高の実行速度を出したチー ムに与えられる。選考委員長はThomas Stirling。委員は、 Bill Gropp, David Keyes, David Bailey and James Demmel。今年は38件の応募があり、6 件がfinalistsとして残った。そのうち3つは地球シミュレータ関係。あと、牧 野さんが日本から。Technical Sessionの二つのコマを用いて論文発表が行わ れたが、木曜日10:30-12:00の2コマ目は"Gordon Bell Earth Simulator"とい うタイトルで地球シミュレータ関係の論文がまとめられてしまった。 結局finalistsのうち牧野さんだけが落ちて5件に授賞され、賞金($1500〜 $1000)が与えられた。牧野さんはもし通っていれば6回目の受賞になっていた ところである。数値は改良されて29.5 TFlopsであったが、昨年と同じGrape-6 での結果であったためであろうか、惜しくも受賞を逃した。受賞論文は以下の 通り。 ○ピーク賞: "A 26.58 Tflops Global Atmospheric Simulation with the Spectroal Transform Method on the Earth Simulator" Satoru Shingu, Yoshinori Tsuda, Wataru Ohfuchi, Kiyoshi Otsuka, ES Center Hiroshi Takahara, Takashi Hagiwara, Shin-ichi Habata, NEC Corporation Hiromitsu Fuchigami, Masayuki Yamada, Yuji Sasaki, Kazuo Kobayashi, NEC Information Mitsuo Yokokawa, AIST Hiroyuki Itoh, NASDA Tom Stirlingが「時間があるから日本人の名前を全部読む」とか言って苦戦し ていた。 ○言語賞(Language -- special category) "14.9 TFLOPS Three-dimensional Fluid Simulation for Fusion Science with HPF on the Earth Simulator" Hitoshi Sakagami, Himeji Inst. Engineering Hitoshi Murai, ES Center Yoshiki Seo, NEC Corporation Mitsuo Yokokawa, AIST IMPACT-3DのHPF版でこのスピードを達成した。 ○差別はないのだが、以下はSpecial Accomplishment Categoryだと言っていた。 "16.4 Tflops Direct Numerical Simulation of Turbulence by a Fourier Spectral Method on the Earch Simulation" Mitsuo Yokokawa, JAERI(ここだけ旧所属。現、産総研グリッド研究 センター) Ken'ichi Itakura, Atsuya Uno, ES Center Takashi Ishihara, Yukio Kaneda, Nagoya Univ. "Salinas: A Scalable Software for High-Perfornace Structural and Solid Mechanics Simulation" Manoj Bhardwaj, Kendall Pierson, Garth Reese, Tim Walsh, David Day, Ken Alvin, James Peery, Sandia National Laboratories Charbel Farhat, and Michel Lesoinne, University of Colorado ASCI White上で 1.16Tflopsを実現した。Sandiaの発表によると、工学のプロ グラムでGordon Bell賞を取ったのは初めてだとのことである。 "NAMD: Biomolecular Simulation on Thousands of Processors" James C. Phillips, Beckman Institute, University of Illinois at Urbana-Champaign Gengbin Zheng, Sameer Kumar, Laxmikant V. Kale, University of Illinois at Urbana-Champaign 4) The High-performance Bandwidth Challenge これは2000年から始まったコンテストで、SCinetを用い、SC会議の期間中に 実際にどれだけのバンド幅を出すかで勝負する。委員長は、Greg Goddard, University of Florida。Qwest社から賞金が与えられる。この結果だけはweb に出ている。通信量の時間変化のグラフもあって面白い。 http://scinet.supercomp.org/bwc/index.html http://scinet.supercomp.org/bwc/results/index.html 参加チームの結果の数値だけ引用する(単位はGb/s、総転送量は省略) Link Type Peak-in -out -bi Avg-in -out -bi Argonne 1 x 10 GigE 3.601 0.116 3.717 1.761 0.033 1.794 DataSpace* 4 x 1 GigE 2.392 0.004 2.396 1.54 0 1.54 JapaneseDataGrid 1 x 10 GigE 0.595 1.691 2.286 0.295 0.917 1.212 LBL 3 x 10 GigE 16.81 0.001 16.811 15.741 0 15.741 NPACI/SDSC 2 x 10 GigE 0.748 0.012 0.76 0.426 0 001 0.427 Sandia 1 x OC-48 0.942 0.934 1.876 0.557 0.701 1.258 SLAC/Caltech 2 x 10 GigE 6.254 6.189 12.443 5.587 5.078 10.665 UNC 1 x 1 GigE 0.689 0.514 1.203 0.081 0.079 0.16 University of Tokyo 1x 1 GigE 0.035 0.55 0.585 0.003 0.208 0.211 -------------------- 3種の賞は以下のとおり与えられた。 ○Highest Performing Application "Wide Area Distributed Simulations Using Cactus, Globus and Visapult " NERSC, LBL 16.8 Gb/sを実現。このグループの受賞は3回目であるが、前回より5倍も向 上している。 ○Most Efficient Use of Available Bandwidth "Data Reservoir " 東京大学、富士通研究所、富士通プログラム技研(代表、 平木敬) 日米間12000kmの高速通信において、TCP/IP通信により、585 Mb/s というネッ トワークバンド幅の95%以上の持続的ネットワーク利用に成功した。信号の latencyを考えただけでも、TCP/IPでこのような成果を出したことは驚異に値 する。 ○Best Use of Emerging Network Infrastructure "Project Dataspace "(Illinoisなどのグループだが不明) Distributed data miningにおいて2.4 Gb/sを達成した。詳細は不明。 グリッドデータファーム(産総研)では、高エネルギー加速器研究機構、東 京工業大学、東京大学、Indiana Univ.、SDSCの協力を得て、MAFFIN、つくば WAN、APAN/TransPAC、NII-ESnet HEP PVC、Abileneなどのネットワークを使い、 190台のパソコンから成るPCクラスタ7システムを統合利用して2.286Gb/sのピー ク記録を達成した。日米間の記録としては、会場のPC 4ノードと産総研の4ノー ドとの間で707Mb/sのデータ転送を実現した。これはAPAN/TransPACの2本太平 用回線(シアトルからの北回線とシカゴからの南回線、いずれもOC-12。ただ し南回線は約半分のバンド幅を利用)の両方を同時に利用して達成したもので ある。この記録の達成のためには、TCP/IPの種々のパラメータの調節や、通過 するネットワークとの調整などいろんな苦労があったようである。会場は10 GB/sのネットワークが繋がっていたが、Tokyo NOCから産総研までが1 Gb/s、 太平用回線が878Mb/sなどのボトルネックが存在した。ピークバンド幅として はデータレザボアに勝っていたが持続的ではなく、惜しくも受賞を逃した。筆 者はわが専攻を中心としたデータレザボア・グループの健闘と優勝を喜ぶと同 時に、G-Farmの落選はJGCFブースの関係者としては残念であった。 いずれにせよ、両チームともかなりの物量を日本から持ち込んでの挑戦で、 想像を絶する苦労があったものと思われる。ブースは隣同士で、実験中には両 者間に火花が飛んでいた(^_^)。 5) HPC Challenge Awards これは3つのカテゴリーにおいてHPCリソースを革新的に利用したものに与え られる。昔は、$10000以内で最高性能を出すというような賞であったが性格が 変わったようだ。受賞者については確認がとれていない。 ○Most Innovative Data-Intensive Application: UK e-Science Pilot Project: DiscoveryNetが受賞した模様。 ImperialCollege of Science, Technology and Medicine, London。代表は Prof. Yike Guo and Dr. John Hassard. ○Most Geographically Distributed Application: ○Most Heterogeneous Set of Platforms: この二つの賞はGlobal Trid Testbed Collaborationという世界中のグリッ ド関係者の連合チームが取ったようである。 プラチナ賞($1500 honorarium), 金賞 ($1000), 銀賞 ($500)があるはずだ が、どれが何処に行ったかも不明。 6) 論文賞 best technical paper ($1000)とbest student technical paper ($500)と best research poster ($250)がある。HPCwire (Dec. 6)によると以下の通り。 ○ The SC2002 Best Technical Paper: Parallel Multistage Gauss-Newton-Kyle Methods For Inverse Wave Propagation Vulcan Acetic and Omar Ghettos, Carnegie Mellon University; George Biros, Courant Institute of Mathematical Sciences at New York University.  波動方程式の逆問題を、256プロセッサで3時間掛けて解いた。未知パラメータ が210万もある問題。 ○The SC2002 Best Student Technical Paper: Active Proxy-G: Optimizing the Query Execution Process in the Grid Henrique Andrade, Tahsin Kurc, Alan Sussman, Joel Saltz  Gridを用いて地理的に分散したデータ検索を行った。 ○Best Research Poster: Faucets: Efficient Resource Allocation on the Computational Grid. Main Posture, Sameer Kumar, Jayant DeSourza, Sindhura Bandhakavi, and Laxmikant Kale, University of Illinois at Urbana-Champaign.  計算パワーを電気や水道のように市場原理によって生産者から消費者に届ける システムFaucetsを開発した。 ======22日金曜日====== 22−1 パネル「特注スパコンは絶滅危惧種か?」 最終日金曜は、展示もなく昼までなので人数が少なく、いつもプログラムに 困る。最近は客寄せに刺激的なパネルを3並列に企画しているようだ。 8:30からのパネルは、 "Are Designer Supercomputer an Endangered Species?" "High End Information Technology Requirements for Homeland Security" "Desktop Grids: 10,000-fold Parallelism for the Masses" であった。筆者は第一に出席した。 そもそも最初タイトルを読み間違えていて、「スパコン設計者は絶滅危惧種 か?」かと思った。これも面白いテーマだったかもしれない。 司会はAruna Ramanan (IBM)。まず渡辺貞氏(NEC)が、「designer supercomputerとは、アーキテクチャと物理的実装の両面において新しく革新 的な設計のスーパーコンピュータを言う。」と定義した後、「地球シミュレー タは、NECのSXの延長上にあり、designer supercomputerではない。もし、ベ クトルスーパーコンピュータは絶滅危惧種か、というなら、そうかも知れない。 しかし、誰が絶滅させようとしているのか?ユーザはベクトルスーパーコンピュー タを望んでおり、その意味では絶滅危惧種ではない。実効性能が実際出るし、 システムソフトウェアも易しい。」とベクトルの優位性を強調した。そして、 「地球シミュレータのインパクトは何か。”頭を上げよ。予算を増やせ”。ペ タフロップスへの道への障害物は、予算、市場性、メモリバンド幅、多数の CPUなど技術的問題など。また、高速通信と高速演算とは互いに相手を要求し ている。グリッドは資源の利用可能性は広げるが、通信が弱い。」と言った後、 マンモスと象の絵を示し、「マンモスは絶滅したが、象は残った。Burtonが70 年代に考えたmultithreadは絶滅したが、hyperthreadとして生きている。」と 結んだ。 Gita Alaghband (U. of Colorado)は、まず"I hope NOT!" と言った後、 「かつてスーパーコンピュータで可能になった技術は今広く利用されている。 新しい技術は高価だが、進歩をもたらす。」と基本的姿勢を述べ後、自分の本 を宣伝した。"Fundamentals of Parallel Processing" Harry Jordan , Gita Alaghband (2002/8/12, Prentice Hall) 「アーキテクチャ、アルゴリズム設 計、プログラム言語、この3つが並列処理の基本だ。性能を決める要素は、メ モリ階層、ネットワーク、プロセッサ、キャッシュ、latency tolerance、ア ルゴリズム、言語、OSなど。Flopsの値が議論されるが、大きな問題には不適 であるし、もちろん、非数値問題には適さない。性能を決めるのは、data transfer capacityである。今後、メモリ階層が増えるにつれてlatencyは増加 する一方だが、バンド幅が得られればどうにかなる。 commodity-off-the-shelfの価格効率比は、並列分散計算に新しい分野を開い た。しかし、多くの問題がある。latency of communication, synchronization, fine grain parallelismなど。結局、研究教育の発想の逆 転が必要である。スーパーコンピューティングにおいて、新しいアイデアと創 造性が必要である。基本に帰れ!」自分の本の宣伝以外何をいいたかったのだ か??? Tom Stirling (Caltech)は、「われわれは今でも特注している。We do custom today!」と力説した。「Beowulf cluster はほとんど死んだ。high density bladesに代わりつつある。LanaiやMyrinetも特注。IA64が出てきたが、 なぜAlphaは死んだのか。なぜItaniumは生きているのか? PlayStation2は6GF の性能を持つ。Infinibandははやるか?なにがdriveになりうるか?今やHPCは ubiquitousだ。今のデスクトップはCray-1より速い。」と状況を述べた後、 「性能への欲求は限界を知らない。問題はlatencyである。従来のアプローチ は変革を必要としている。プロセッサの限界、メモリの限界。あまりに難しく てプログラムできない。too big, too hot。これにはいくつかのアイデアがあ る。PIM, polymorphism, adaptive reconfiguration, evolution through revolution。新しい種は、従来の種が飽和してS字カーブを描いた時に生じる。 PIMは不可避である。MIND (Memory Intelligent & Networking Devices)、 HPCS (High Productivity Computing System)」などよく分からなかったが新 しいアイデアの重要性を述べた。結論として「ビジネスモデルとして、下方に スケーラブルである必要がある。傲慢を避けよ。」 Candace Culhane (NSA 国家安全保障局) が話そうとしたとき液晶プロジェ クタが動かなくなり、彼女は口だけで語った。「地球シミュレータはnew capability of scienceを示した。では未来のアーキテクチャはどうなるのか。 NSAで2年間の調査をした。対象は社会的な問題である。ポイントは3つある、 1) プログラミングの易しさ。プログラミングパラダイムが重要である。 2) スケーラビリティ。10000〜100000台まで。 3) nomenclature(意味不明)時間の問題。何がもっともパワフルなマシンか? このような我々の要求を満たすようなシステムデザインが必要だ! 価格性能 比も重要だが、我々のミッションを解決できるかが一番の問題だ。何がチャレ ンジかはよく分かっている。」要するに、ベクトルが欲しいと言うことか? Jamshed Mirza (IBM, server group)のプロジェクタはちゃんと動いた。 「問題は3つある。 1) 市場のダイナミックス。売り上げのドライブ、投資、技術革新。 2) メインストリームとの互換性。[これを言うところがさすがIBM] 3) 新しいアプローチ(メインストリームとは違う)。 地球シミュレータは、Top500で新しい平坦部(plateau)を作ったが、12ないし 18ヶ月で越せるだろう[ASCI Purpleのことを言っているのか。それともその 前か。] Blue Geneはdesigner systemであるが、メインストリーム技術の延長線でペ タフロップスは可能だ。問題は発熱だ。だんだん、原子炉炉心の熱密度に近づ いている。それから、プロセッサとメモリのバランスが悪くなっている。例え ば、1チップ上にSMPができる。まあほとんどの面積はDRAMだが。これを10GHz で動かせばよい。他の可能性は、光接続だ。アキレス腱はソフトウェアだ。 "No Moore's law with respect to software!" オープンソースは問題を解決 するか? あとの問題は価格。価格の制御が難しい[これもさすがIBM]。 autonomic featuresが大事である[これもIBMの最近のスローガン]。段階的な 増強 (incremental changes)でペタフロップスまで行ける。」IBMのシステム 技術なら、汎用の商品と特注スパコンとは連続的につながっているということ らしい。 例によってフロアとの質疑応答の時間はあまりなかったが、MD-Grape/Wine をどう思うか、という質問が、Fernbach 賞を受賞した Robert Harrisonから 出た。残念ながら司会者はMD-Grapeが何かを知らなかったみたい。Mirza氏、 「pay backが十分高ければ考えられる。」渡辺氏「問題は市場性。 PlayStationは特注だが、大きな市場があった。」 なにかあまりかみ合わないパネルであった。 22−1 地球シミュレータのインパクト 後半10:30〜12:00には次の3つのパネルが平行して開かれた。 "The 40 TFlop/s Earth Simulator System: Its Impact on the Future Development of Supercomputer" "Planning for a Homeland Security Research Agenda" "Truth and Consequences: The Making of discovery Channel 'Unfolding Universe'" 筆者は第一のパネルに出た。司会はHorst Simon (NERSC, LBL)。Simonはあ らかじめ5つの質問をパネリストに与えた。よく聞き取れなかったがだいたい 次の通り。 1) 計算科学全般へのインパクト、特に気候シミュレーションに対して。 2) このように抜きんでた(Simonはquantum-leapをした、と表現した)スーパー コンピュータから、どのような知的・科学的な利点があるか。 3) 地球シミュレータの成功は、off-the-shelf のクラスタやアメリカのベク トル計算機にどのような意味があるか。 4) アメリカは何をすべきか。 5) 単に競争するだけでなく、高エネルギー加速器のように、国際協力によっ て地球シミュレータのような大システムを共同で作ることは考えられるか。 John B. Drake (ORNL) は、気候モデリングの専門家である。ただし、彼の 名前はプログラムにはなかった。その立場から、気候予測がコンピュータの能 力によって制限され、長期の予報をし、しかもアンサンブル平均を取るために はいかに高能力の計算機が要求されるかを力説した。「地球シミュレータ規模 のコンピュータは多くの事を可能にする。ベクトルかキャッシュかは問題では ない。」競争については、「初めから我々は競争ではなく協力している。」と 述べた。 David Kahaner (ATIP)は、まず地球シミュレータのインパクトについて、 「計算科学の面からは、日本が2年間もリードすることの意味は大きい。アメ リカはHPCの独占を破られたのだ。」と述べた。コモディティ・クラスタにつ いては、「たしかにコストは安いが、メモリ速度など多くの制限がある。”ベ クトルは死んでいない”しかし、スカラーで何処まで行くかが問題。」と述べ た。アメリカへの意味としては、「議会はかなりの投資による研究開発をを承 認するだろう。」と予想。競争と国際協力については、国家の威信が絡んでい て難しい。SX-6もPrimepowerも重要な製品だ。スペースステーションやSSCの ような多国籍プロジェクトは政治の次元の問題となってしまう。問題は、どん な科学の分野に焦点を当てるかだ。」と述べた。 中村壽(高度情報科学技術研究機構)は、インパクトについては、「スピー ドは力だ、ということを皆が認識したこと、と、新しい発見(例えばナノカー ボンなど)への期待がもてること」だと述べた。科学上の利点については、 「複雑系へのチャレンジにおいて、不可能を可能にすることである。」と、ア メリカとの競争については、「Noblesse oblige(高い身分に伴う義務)、 Patienceだとまずは神妙に。しかし、"We are Power Guzzler!"(計算パワー を飲み尽くす連中だ)、さらに100TFlops、1 PFlopsが必要。地球シミュレー タの次が重要。」と述べた。国際協力については、例としてACES (APEC)と Next Generation Climate Modelsと、SSS200Xを挙げた。よく分からないが、 すでにやられているということであろうか。ついでに、「地球シミュレータは 限られたメンバーが占有して使え,junk usersがいないので使い勝手がいい」 というようなことをおっしゃったら、会場では苦笑いが渦巻いた。 佐藤哲也(地球シミュレータ)も飛び入りであったが、地球シミュレータが 複数階層の統合的なシミュレーションを可能にしたことを強調し、これを holistic simulationと名付けた。 Burton Smith (Cray Inc.) は、まず「地球シミュレータは、ダイノザウル スの復活だ。」と述べた。「SC'89のときEugene Brooksが、”killer micros の攻撃に何者も勝てない”と予言したが、嘘であることが分かった。」と、さ りげなくCray社の事業を宣伝。地震波の伝播の図を示したあと、「1000x1000 のLINPACKでは、SX-6はPentium 4よりはるかに速い。」と指摘。彼は、HPCの 問題とシステムをType T(CPUのトランジスタで値段のついているマシン、す なわちクラスタなど。相互接続は弱い)と、Type C (相互接続のバンド幅に 金を掛けているシステム。ベクトルはその典型。もしかしたらMTAも?)の2種 に分類し、地球シミュレータはType C だと言いたいらしい (http://www.scd.ucar.edu/dir/CAS2001/CASpapers/BSmith.PPT 参照)。「高 価か、それはsocial instrumentをどう見るかと言うことだ。スペースステー ションよりは遙かに安い。」アメリカへのインパクトとしては、「Is commercial problem all Type T?」と言っていた。「ここから我々は何処に行 くのか? Type C計算機を作るのか。地球シミュレータやCray X1やBlue Planet [http://www.nersc.gov/news/blueplanet.html。DOEを中心にViVA -- Virtual Vector Archtectureに基づいて地球シミュレータをしのぐ160 TFの計 算機を作る計画。IBM担当。]を作るのか。」国際協力については、「アーキテ クチャの観点からは、遺伝子が混ざるのはよくない。[船頭多くして船山に登 る、ということか?]」と否定的だった。 結局、アメリカもHPCに予算を出せという予定の結論になったようだ。 このパネルでSC2002は終わり、午後はBaltimoreやWashington DCなど の見物をした人が多かったようだ。 -----------------------------------