初版2011/12/12
改訂2011/12/14
SC2007報告(簡略版)
小柳義夫
 
http://olab.is.s.u-tokyo.ac.jp/~oyanagi/reports/SC2007.html
(再配布は自由ですが、上記ページから最新版をご利用ください。)
http://olab.is.s.u-tokyo.ac.jp/~oyanagi/conf.html にはその他の国際会議の報告などがありますので、ご興味があればご笑覧ください。
この報告が完成してないことに今頃(2011/12)気づきました。4年も経ってしまいましたので、簡略版です。
 
 
1.はじめに
 
 SC07: The International Conference for High Performance Computing, Networking, Storage and Analysis (通称 Supercomputing 2007) は、20回目の今年、Casinoの街、ネヴァダ州リノのReno-Sparks Convention Center で11月10日(土)から16日(金)まで開催された。今年は標語がなかったようである。会議名は昨年と同じで、"Analysis" を名乗っている。リノは、第2回のSC'89 が開かれているので2回目である。SC'89 は筆者が最初に参加したSCであった。その時、Evans and Sutherlandが新しいベクトルコンピュータを製造したと言うのでそのブースを眺めていたら、三浦謙一氏(当時富士通、現国立情報学研究所)に、「展示を見てもしょうがないよ。この会社[厳密にはスーパーコンピュータ部門]は今日つぶれたんだから。」と言われたことを覚えている。広いホテルの1階が見渡す限りカジノでびっくりした記憶がある。
 
2.会議の歴史
 
 毎度のことであるが歴史を示す。この会議はアメリカの東西で交互に開かれて来た。年次、開催都市、展示・チュートリアル等を含めた総参加者数、technical program有料登録者数、総展示数、投稿論文数、採択数、採択率を示す。初期の回では、テクニカルプログラム登録者という概念がなかった模様である。このデータの一部はこの会議の創立者の一人であるAl Brenner氏に2007年11月末に提供していただいたものによる。参加者の定義にどこまで入れるは微妙なところがあり、±10%程度の精度と考えてほしいとのことである。
回数年号
 
場所
 
総数
 
tech.
 
展示数
 
投稿数
 
採択
 
採択
1回(1988) Orlando 1495   36 150 60 40%
2回(1989) Reno 1926   47 ? 88  
3回(1990) New York 2303   59 ? 92  
4回(1991) Albuquerque 4442 1711 80 215 83 39%
5回(1992) Minneapolis 4636 1805 82 220 75 34%
6回(1993) Portland 5196 1886 106 300 72 24%
7回(1994) Washington 5822 2067 122 ? 77  
8回(1995) San Diego 5772 2254 106 241 69 29%
9回(1996) Pittsburgh 4682 1642 121 143 54 38%
10回(1997) San Jose 5436 1837 126 334 57 17%
11回(1998) Orlando 5750 1984 130 270 54 20%
12回(1999) Portland 5100 2124 149 223 65 29%
13回(2000) Dallas 5051 2096 159 179 62 35%
14回(2001) Denver 5277 2017 155 240 60 25%
15回(2002) Baltimore 7200 2335 221   67  
16回(2003) Phoenix 8942 2901 219 207 60 29%
17回(2004) Pittsburgh 8983 2923 266 192 59 31%
18回(2005) Seattle 10140 3430 276 260 62 24%
19回(2006) Tampa 9000+   258 239 54 23%
20回(2007) Reno 9200 3737 314   54  
 
私は、第1回、第4回、第12回、第19回は出席できなかった。ちなみに、来年21回は20周年を記念して、Texas州Austin で "20 years -- Unleashing the Power of HPC"の標語の下に11月15日〜21日の日程で行われる。
 
3.全体像
 
 会議はあまりにも巨大で、全体像をつかむことは困難である。昨年は空前の参加者、総展示数となったが、今年は参加総数がさらに増えたとのことである。
 
4.展示
 今年の展示会場のブース面積合計は、132172 ft2=12300 m2=3700坪であった。企業展示が197件、研究展示が117件であった。このうち、73件は新規の参加である。
 今年の珍事件は、13日(月曜日)の昼に会場が停電したことである。私はそのとき会場の隣の中華料理屋で食事をしていたが、突然照明が消えてしまった。程なく回復したので、店のブレーカーが飛んだとばかり思っていた。会場に戻ると大騒ぎで、照明、ネットワーク、無線LANなどが一斉に飛んでしまったとのことであった。つまり、会場で電気を使い過ぎて、会場を含む地域一帯が停電したようである。午後になって係員が各ブースを訪れ、致命的な障害がなかったか聞き回っていた。
 
4.1 アジアからの研究展示
 日本からの研究展示は以下の22件。最後の数字はブース番号
 
- Advanced Center for Computing and Communication RIKEN 985
- AIST 765
- Center for Computational Sciences, University of Tsukuba 2651
- Doshisha University 3135
- Ehime University and NiCT 112(復活)
- GRAPE Projects 989
- IIS - Institute of Industrial Science, University of Tokyo 2909
- IST/CMC, Osaka University 3059
- ITBL 2959
- JAEA (Japan Atomic Energy Agency) 3033
- JAXA (Japan Aerospace Exploration Agency) 979
- Kansai University 2806(初参加)
- Kyushu University 3199(復活)
- National Research Grid Initiative (NAREGI) 773
- [PC Cluster Consortium 747]
- Research Organization for Information Science and Technology (RIST) 178
- Research Organization of Information and Systems Research (ISM) 2955
- Saitama Institute of Technology 1075
- Saitama University 1079
- T2K Alliance (e-Society, the University of Tokyo) 2822
- Tohoku University 3009
- University of Tokyo (GRAPE-DR) 2133
 
 このほかアジア太平洋地区からは、オーストラリアを含め7件あった。
- Asian Technology Information Program (International)
- Institute of High Performance Computing (Singapore)
- Korea Institute of Science and Technology Information (KISTI) Supercomputing Center (Korea)
- National Center for High-Performance Computing (Taiwan)
- PSPACE, Inc. (Korea)
- Thai National Grid Center (Thailand)
- Victorian Partnership for Advanced Computing (VPAC)(Australia)
 
合計29件という数は、これまでの最高である。タイからは初めてだと思われる。
 
4,2 企業展示
 企業展示で印象に残ったものは以下の通り。
1) IBM
 BlueGene/PやPower6を使ったサーバ(水冷)を展示していた。
2) Cray
 CrayはXT5を発表した。最高20 PFを実現するとのことである。今後2008年中には1 PF、2011年には20 PFを狙う。また、XT5hの系列はh(ハイブリッド)を意味し、Opteronに加えて、XMT (multithread), XR1 (FPGA), X2 (vector)、SIO (accelerator)など他のアーキテクチャを付加する。ついに、Crayでさえベクトルプロセッサを付加プロセッサとして位置づけてしまったことは感慨深かった。
3) Sun Microsystems
 巨大なInfiniband switchのMagnum SwitchをつかったTACC (Texas Advanced Computer Center) のRanger (peak 500 TF) はTop500に出てこなかった。トップを取るとすれば今回だと言われていたので残念であった。
4) SGI
 ニュー・メキシコ州のComputing Application Centerに導入したAltix ICEがTop500の3位にランクされた。来年には1 PFのスパコンを提供すると豪語した。
5) 富士通
 自社製のCPUとしてSparc系列のSPARC64 VII (quadcore)を展示していた。データバスにかなりの物量を投入し、メモリ・バンド幅を確保しているもよう。次世代スパコン(スカラー部分)の一歩前の製品と思われる。もう一つ、4個のBarcelona chip (Opteron) を載せたボードも展示していた。T2Kのボードであろう。ネットワークとしては、10 GbEを展示していた。
6) NEC
 NECは次期SX9用の新しいベクトルチップを紹介していた。地球シミュレータのアップグレードに使われることになろう。これも次世代スパコン(ベクトル部分)の一歩手前の製品と思われる。[結果的にはNECは次世代スパコンから撤退した。]
7) 日立
 BladeSymphonyを展示していた。Power6チップを用いたSR11000の後継機を発表した。富士通と同様、quadcore Opteronを搭載した製品計画を発表した。
8) ClearSpeed
 新しい1 TFのサーバーをデモするとともに、アプリの広さを強調していた。
9) AMD
 FireStream9170を展示。これは合併したATI社の系統の技術で、当時では初の倍精度浮動小数点演算能力をもつストリームプロセッサである。メモリも2 GB積んでいる。2008年第1四半期発売とのことである。
10) Microsoft
 マイクロソフト社は、MS Compute Server 2003の後継に当たるWindows HPC Server 2008のベータ版を発表した。
11) D-wave Systems
 これにはびっくりした。史上初の商用量子コンピュータと自称し、28 qubitを実現したと説明していた。実物はカナダ(ブリティッシュコロンビア)の本社にあり、ネットワークでつないでいるとのことである。皆で眉に唾を付けながら展示を見ていたが、よく分からない。ニュースによると、グーグルの科学者もデモに参加したとのことである。
12) Nortel
 HPCとは関係ないが、Nortel社がいわゆる100ドルPCを出展していた。これはOLPC (One Laptop per Child)プロジェクトの成果である。CNNニュースによると、この「100ドルPC」は、米マサチューセッツ工科大(MIT)の研究者らが提案したアイデア。途上国での使用を想定して手回し式の発電装置をつけ、ハードディスクの代わりにフラッシュメモリーを搭載する。OSはLinux (Fedora)。ディスプレーは、バックライトなしでも見ることができるが、その場合は白黒となる。量産は台湾のメーカー、Quanta Computer(広達電脳)に委託し、各国政府を通して子どもたちに配布する予定。先進国では倍の値段で売り、1台売る毎に、もう1台を途上国に寄付する。http://laptop.org/index.jp.htmlから写真を示す。現在はこのサイトはないようで、詳細はhttp://en.wikipedia.org/wiki/$100_laptopを参照。
        
5.IEEE Awards
 SC会議ではいくつかの価値ある表彰がなされる。
5.1 Sidney Fernbach Award
 これは、応用分野で顕著な業績を上げたものに与えられる。今年の受賞者はDavid E. Keyes (Columbia)で、表彰理由は、
For outstanding contributions to the development of scalable numerical algorithms for the solution of nonlinear partial differential equations and exceptional leadership in high-performance computation.
である。授賞式の直前に、彼とIJHPCA (International Journal for HPC Applications)誌の編集委員会で一緒だったが、なんとかれはKAUST (King Abdulah University of Science and Technology、サウジアラビア)に転職するとのことであった。
5.2 Seymour Cray Award
 この賞は、Seymour Crayのようなアーキテクチャ上の貢献に対して与え
られる。今年の受賞者はKenneth E. Batcher (former Goodyear)であった。表彰理由は、
For fundamental theoretical and practical contributions to massively parallel computation, including parallel sorting algorithms, interconnection networks, and pioneering designs of the STARAN and MPP computers.
である。ちなみに、GoodyearのSTARANは一種のArray Processorで、4×256の1ビットプロセッサからなる。GoodyearのMPPは128×128の1ビットプロセッサである。いずれもSIMDとして動作。MPPの開発は1979から行われたが、1983年にNASA Goddard Space Flight Centerに出荷され、1985年から1991まで使用された。Goddardでは、MPPの後継機としてMasParのMP-1とCray T3Dが設置された。
 
6.Gordon Bell賞
 これもIEEEの賞であるが、Gordon Bell氏が毎年10000ドルを供出して、応用上意味のある高性能計算の成果を出したグループに与えられる。今年のFinalistsは以下の通り。日本から2件が残ったが、いずれも受賞しなかった。受賞は3番であった。
 
1) MDGRAPE-3によるX線タンパク構造解析で281TFLOPSの性能を示した理化学研究所のYousuke Ohno氏等のチーム
 
2) 地球シミュレーター上で第一原理シミュレーション・コード PHASEを使い大規模半導体系を解き、14.6 TFLOPS(理論ピーク性能の59%)を達成した物質・材料研究機構のTakahisa Ohno氏等のチーム
 
3) Blue Gene/Lを使ってケルビン-ヘルムホルツ不安定性の最初のミクロン・スケールの計算で54.4TFLOPSを示したLawrence Livermore National
Laboratory(LLNL)のJames N. Glosli氏等のチーム(受賞)
 
4) LLNLのBlue Gene/Lで数値気象予報の中でも高分解能なWeather Research and Forecast (WRF) モデルを計算したUniversity Consortium for Atmospheric ResearchのJohn Michalakes氏等のチーム
 
6.その他の賞
6.1 Best Paper, Best Student Paper, Best Poster
 毎年表記のような論文賞が与えられる。誰が受賞したかメモできなかった。
 
6.2 ACM/IEEE Computer Society HPC Ph.D. Fellowship Award
 これも最近毎年与えられる。
 
6.3 Cluster Challenge
 今年からできたコンテストで、学生数人と先生1人でチームを作り、SC会場の一角で48時間以内にクラスタを組み立て、LINPACKを走らせる。クラスタの材料はチーム毎にベンダから提供される。今年の参加者と優勝者は以下の通り。
 
1) Stony Brook University + Dell
2) National Tsing Hua University (Taiwan) + ASUSTek
3) University of Colorado + Aspen Systems
4) University of Alberta (Canada) + SGI (受賞)
5) Indiana University + Apple
6) Purdue University + HP
 
6.4 Analytics Challenge
 昨年あたりからできたコンテストで、解析を競う。参加者と受賞者は、
 
1) Angle: Detecting Anomalies and Emergent Behavior from Distributed Data in Near Real Time (UIUC) (受賞)
2) Cognitive Methodology-based Data Analysis System for Large-scale Data Yoshio Suzuki, Chiaki Kino, Noriyuki Kushida, Norihiro Nakajima(JAEA)
 
6.5 Bandwidth Challenge
 通信のバンド幅を競うコンテスト。参加者と受賞者は以下の通り。
 
- iWarp-based Remote Interactive Scientific Visualization (佳作)
- Streaming Uncompressed 4k Video
- Distributed Data Processing over Wide Area Networks
- Phoebus
- A Virtual Earth TV Set via Real-time Data Transfer from a Supercomputer (Ken T. Murata, Yasuichi Kitamura, Eizen Kimura, Keiichiro Fukazawa, Ehime-NICT)
- Using the Data Capacitor for Remote Data Collection, Analysis, and Visualization (受賞)
- TeraGrid Data Movement with GPFS-WAN and Parallel NFS
 
6.6 Storage Challenge
 ディスクからの読み出しや書き込みの速度を競う.参加者と受賞者は下記の通り。
 
- ParaMEDIC: A Parallel Meta-data Environment for Distributed I/O and ComputingLarge Systemで受賞)
- Zest: The Maximum Reliable TBytes/sec/$ for Petascale Systems (PSC)
- Astronomical Data Analysis with Commodity Components (LANL)Small Systemで受賞)
- Grid-oriented Storage: Parallel Streaming Data Access to Accelerate Distributed Bioinformatics Data Mining
 
7.Top500
 10位までを記す。括弧内は昨年の順位。トップは前回に引き続きLLNLのBlueGene/Lであるが、約60%プロセッサを増やし478.2 TFを達成した。驚いたのは4位にインドが登場したことである。タタ・グループのComputational Research Laboratoriesに入ったHPのシステムである。アメリカのマシンは合計284台。
 
1 BlueGene/L - eServer Blue Gene Solution, IBM (LLNL)
2 JUGENE - Blue Gene/P Solution, IBM (FZJ)
3 SGI Altix ICE 8200, Xeon quad core 3.0 GHz, SGI (NM)
4 Cluster Platform 3000 BL460c, Xeon 53xx 3GHz, Infiniband, Hewlett-Packard (India)
5 Cluster Platform 3000 BL460c, Xeon 53xx 2.66GHz, Infiniband, Hewlett-Packard (Sweden)
6(3) Red Storm - Sandia/ Cray Red Storm, Opteron 2.4 GHz dual core, Cray Inc. (SNL)
7(2) Jaguar - Cray XT4/XT3, Cray Inc. (ORNL)
8(4) BGW - eServer Blue Gene Solution, IBM
9 Franklin - Cray XT4, 2.6 GHz, Cray Inc. (NERSC)
10(5) New York Blue - eServer Blue Gene Solution, IBM
 
日本の最高位は、
16 GSIC Center, Tokyo Institute of Technology
JapanTSUBAME Grid Cluster - Sun Fire x4600 Cluster, Opteron 2.4/2.6 GHz and ClearSpeed Accelerator, Infiniband
NEC/Sun 11664 2007 56430 102021
であった。前回より2位下がった。
 かつてはトップ20の半数を占めたことがあるのに、最近は全然振るわない。アメリカ、ドイツ、スエーデン、スイスだけでなく、インドにも負けている。日本からの参入は以下の通り。順位、サイト、製造業者、システム名、完成年、コア数、Rmax、Rpeakである。SR11000はコア数でなく、ノード数ではないかと思われる。2002年から2004年までトップを占めた地球シミュレータも今や30位である。
 
 
 Green500も発表された。これは昨年始まった消費電力あたりの性能を競うリストである。
 
BlueGene/Pが上位を独占している。
 
8.HPC Challenge
 HPC Challenge Award CompetitionはDARPA High Productivity Computing Systems (HPCS) ProgramとIDCの共催である。ホームページ(http://www.hpcchallenge.org)によると。結果は以下の通り。Submitterは省略した。
 
8.1 Class 1 Awards
G-HPL Achieved System Affliation
1st place 259 TF IBM BG/L LLNL
1st runner up 94 TF Cray XT3 SNL
2nd runner up 67 TF IBM BG/L IBM T.J.Watson
G-Random Access Achieved System Affiliation
1st place 35.5 GUPS IBM BG/L LLNL
1st runner up 33.6 GUPS Cray XT3 SNL
2nd runner up 17.3 GUPS IBM BG/L IBM T.J.Watson
G-FFT Achieved System Affiliation
1st place 2870 GF Cray XT3 SNL
1st runner up 2311 GF IBM BG/L LLNL
2nd runner up 1122 GF Cray XT3 Dual ORNL
EP-STREAM Triad Achieved System Affiliation
1st place 160 TB/s IBM BG/L LLNL
2nd runner up 77 TB/s Cray XT3 SNL
1st runner up 55 TB/s IBM Power 5 LLNL
 
8.2 Class 2 Awards
Award Recipeint Affiliation Language
Most Productive Research
Implementation
Vijay Saraswat
 
IBM
 
X10
 
Most Productive Commercial
Implementation
Sudarshan
Raghunathan
Interactive
Supercomputing
Python/
Star-P
 
 
9.総合講演
9.1 基調講演
 火曜日の基調講演は、Neil Gershenfeld (Director, The Center for Bits and Atoms, MIT) "Programming Bits and Atoms "であった。内容は忘れました。
 
9.2 招待講演(水曜日)
 水曜日のplenaryの招待講演は次の2つであった。
 
-Dr. Raymond L. Orbach
Under Secretary for Science
Department of Energy
The American Competitiveness Initiative: Role of High End Computation
-Dr. George Smoot
University of California Berkeley and
Lawrence Berkeley National Laboratory
2006 Nobel Prize in Physics
Cosmology's Present and Future Computational Challenges
 
 Orbach氏は、エネルギー省の研究担当の次官であり、HPC推進派として知られている。今後、エネルギー省のHPC予算をどんどん増大していくという景気のよい講演であった。Smoot博士は、宇宙背景放射にわずかな異方性があることを発見し、ビッグバンが膨張するとともにこの異方性が成長して、宇宙の構造を作ったことを示して、John C. Matherとともに前年のノーベル物理学賞を受賞した。
 
9.3 招待講演(木曜日)
 木曜日のplenaryの招待講演は次の2つであった。
 
- Prof. Dr.-Ing. Michael M. Resch
Director, High Performance Computing Center Stuttgart (HLRS)
University of Stuttgart, Germany
HPC in Academia and Industry - Synergy at Work
- David E. Shaw
D. E. Shaw Research, LLC and Center for Computational Biology and
Bioinformatics,Columbia University
Toward Millisecond-scale Molecular Dynamics Simulations of Proteins
 
10.原著論文
 投稿論文数は不明であるが、採択された論文は54件である。日本からの発表は、
 
- Junichiro Makino, Kei Hiraki, Mary Inaba
GRAPE-DR: 2-Pflops Massively-Parallel Computer with 512-Core, 512-Gflops Processor Chips for Scientific Computing”
だけであった。
 なお、平木敬、松岡聡両氏は日本からのプログラム委員であった。
 
11.パネル
 7つほどのパネルがあった。
11.1 Fifty Years of Fortran
 今年はFORTRANが世に現れてから50周年である。1957年4月15日にIBM704のために作られたそうである。Jim Grayの"In the beginning there was Fortran." という名言(?)が紹介された。
 David Paduaは、「現在のチャレンジは1957年と似ている。」と述べた。つまり、言語とコンパイラのコ・デザインの重要性を指摘した。
 言語の方向性については全く相反する意見が出された。John Levesqueは「Fortran77に帰れ」と述べたのに対し、Richard Hansonは「もっと進化させよ。x=A.ix.b(連立一次方程式Ax=bを解くことらしい)とか」と逆の意見を述べた。
 
11.2 Exotic Architecture
 CellやGPU、FPGAなどをどう考えるかというパネル。司会はRob Pennington。
 Jack Dongarra, "Experiments with Linear Algebra Operations" Cellでのmixed precisionの話など。
 Wen-mei Hwu, "GPU accelerator and HPC Applications"
 Tarek El-Ghazawi, "FPGA vs. Multicore"
 Paul Woodard, "Scientific computation on the Cell Processor"
 Douglass Post, "APragmatist's View 'Nirvana or Monster?'"
内容は忘れました。
 
11.3 Return of HPC Survivor -- Outwit, Outlast, Outcompute: "Xtreme Storage"
 これは、金曜日午前のパネル。木曜日で展示が終わり、evening eventも終わると、金曜の朝に帰ってしまう人が多いので、金曜日には人寄せのパネルが企画されている。去年からの継続だが、今年のテーマはストレージである。司会はCherri M. Pancake (Oregon州立大学)で、Applause Meter(発言が聴衆にどれぐらい受けたかを計るメータ担当)は去年と同じAl Geist。
 Jack Dongarra 「Googleに倣ってストレージに広告を付ければ誰でもいくらでもタダで使える。NSAにも覗かせて金を取る。熱が心配なら北極に置けばよい。場所が足りなくなったら、宇宙に置けばよい。」
 Ewing Lusk 「iPod-nanoには8GBのメモリが付いている。将来、iPod-femtoが出来れば針の先に数TBのメモリが載る。これを体中につけて、帽子の太陽光発電で駆動する。」
 
12.ワークショップ
 いくつかのワークショップも開かれた。ワークショップは、会場は会議側が提供するが、企画はそれぞれの自主に任されているようである。11日(日)にはAIP主催で3rd China HPC workshop, “HPC in China: Solution Approaches to Impediments for High Performance Computing” が開かれた。筆者は参加しなかったが、ATIPのニュースによると、38の発表があり、中国政府のHPC計画、中国の大学や研究所の研究、中国のHPC市場の状況、HPCベンダーの展望などが議論された。
 
13.今後の方向性
 Mooreの法則に従ってトランジスタ数が18ヶ月に倍増するが、これをどう使うか。Out-of-order実行、分岐予測、投機的実行などを行っても、命令レベル並列性はそれほど増えない。結局、マルチコア、メニーコア、アクセラレータに使うことになるが、データに入出力が追いつかない(いわゆるmemory wall)。演算チップ内にメモリを置くことになるが、これをキャッシュ(プログラムから見えない)として使うか、バッファ(プログラムできる)として使うか。さらにチップ内並列処理をどう記述するか。
 様々な空間的制約がある、チップ内のコア間の通信、キャッシュの容量・階層構造をどうするか、コヒーレンシの制御をどうするか、コアが増えると共有化キャッシュのポートが増え、作りにくくなる。などなど。
 SC07では、Cell processor とNVIDIAが注目されていた。64ビットのフルサポートが問題である。ClearSpeedはあまり話題になっていない。ハードの進展はなく、応用の拡大に力を注いでいる模様。その後2008年には事業の縮小を余儀なくされた。
 IntelはメニーコアのTera-scale processorに進むようだ。
 
 というわけで、残っているメモから会議の一部を紹介しました。
 
----------------------------------------------------------------