プレスリリース
スーパーコンピュータ「富岳」を用いてGraph500の世界第1位を獲得 −8期連続、ビッグデータ処理で重要なグラフ解析性能で首位−
理化学研究所、九州大学、株式会社フィックスターズ、日本電信電話株式会社(以下「NTT」)、富士通株式会社による共同研究グループ※は、スーパーコンピュータ「富岳」[1]を用いた測定結果を更に向上させ、大規模グラフ解析に関するスーパーコンピュータの国際的な性能ランキングである「Graph500」のBFS(Breadth-First Search:幅優先探索)部門において世界第1位を獲得しました。「富岳」としては8期連続で世界第1位となります。
このランキングは、現在米国コロラド州デンバーのコロラド・コンベンション・センターおよびオンラインで開催中のHPC(ハイパフォーマンス・コンピューティング:高性能計算技術)に関する国際会議「SC23」に合わせて、Graph500 Committeeから11月14日(日本時間11月15日)に発表されます。
大規模グラフ解析の性能は、大規模かつ複雑なデータ処理が求められるビッグデータの解析における重要な指標です。共同研究グループは、今期から高速グラフ解析に実績を持つNTTを加え、「富岳」の性能を一層発揮させるソフトウェア技術の検討を進めています。
[画像1]https://user.pr-automation.jp/simg/2341/79273/700_468_2023111321284965521681bdb0c.jpg
スーパーコンピュータ「富岳」
※共同研究グループ
理化学研究所 計算科学研究センター プログラミング環境研究チーム
チームリーダー 佐藤三久(サトウ・ミツヒサ)
上級技師 児玉祐悦(コダマ・ユウエツ)
技師 中尾昌広(ナカオ・マサヒロ)
九州大学 マス・フォア・インダストリ研究所
教授 藤澤克樹(フジサワ・カツキ)
株式会社フィックスターズ
エグゼクティブエンジニア 上野晃司(ウエノ・コウジ)
ディレクター 高木 瞭(タカギ・リョウ)
シニアエンジニア 井上雄登(イノウエ・ユウト)
シニアエンジニア 柴田敦也(シバタ・アツヤ)
シニアエンジニア 大野真暉(オオノ・マサキ)
シニアエンジニア 寺西寛人(テラニシ・カント)
シニアエンジニア 進藤直佑(シンドウ・ナオスケ)
シニアエンジニア 鈴木浩介(スズキ・コオスケ)
エンジニア 阪本哲郎(サカモト・テツロウ)
エンジニア 南 規楽(ミナミ・キラク)
日本電信電話株式会社 コンピュータ&データサイエンス研究所
主幹研究員 高橋寛幸(タカハシ・ヒロユキ)
主任研究員 及川一樹(オイカワ・カズキ)
主任研究員 新井淳也(アライ・ジュンヤ)
社員 尾形嵐士(オガタ・アラシ)
社員 今西遼人(イマニシ・リョウト)
1.「富岳」測定結果
共同研究グループは、「富岳」の152,064ノード[2](全体の約95.7%)を用いて、約4.4兆個の頂点と70.4兆個の枝から構成される超大規模グラフに対する幅優先探索問題を平均0.51秒で解きました。
「Graph500」のスコアは、138,867GTEPS(ギガテップス)[3]で前回(2023年6月)の性能から1,771GTEPS向上させました。
<関連リンク>
Graph500ランキング
https://graph500.org
2.Graph500について
実社会における複雑な現象は、大規模なグラフ(頂点と枝によりデータ間の関連性を示したもの)として表現される場合が多いため、コンピュータによる高速なグラフ解析が必要とされています。例えば、ソーシャル・ネットワーキング・サービス(SNS)などでは、「誰と誰がつながっているか」といった関連性のあるデータを解析する際にグラフ解析が用いられます。さらにSociety 5.0[4]に向けた取り組みにおいて、IoT(Internet of Things)などの技術で取得された大量のデータをグラフに変換して計算機で高速処理することにより、新しい価値を産み出す新規ビジネスの開拓が推進されています。これらは新しい産業の創出と廃棄物排出の削減の両立を目的としており、「持続可能な開発目標(SDGs)[5]」のうち特に9(産業・技術革新・社会基盤)および11(持続可能なまちづくり)の推進に大きく寄与することが期待されています。このような多種多様な応用力を持つグラフ解析の性能を競うのが「Graph500」です。
「Graph500」は2010年に始まり、BFS(Breadth-First Search:幅優先探索)、SSSP(Single-Source Shortest Path:単一始点最短路)、Green(BFSの電力効率)の3部門それぞれのランキングが年に2回更新されます。BFSおよびGreen部門では頂点間の枝の長さが同じグラフを扱うのに対し、SSSP部門では頂点間の枝の長さが異なるグラフを扱い、単位時間(1秒)当たりの処理数でランキングします。
「Graph500」では大規模グラフを扱うため、グラフのデータを複数台のノードに分散して配置する必要があり、「富岳」のような大規模ネットワークを持つシステムでは通信性能の最適化も重要になります。共同研究グループは、スーパーコンピュータ上で大規模なグラフを高速に解析できるソフトウェアの開発を進めており、これまでの成果として下記(1)〜(4)の先進的なソフトウェア技術を高度に組み合わせることにより、今後予想される実データの大規模化および複雑化に対応可能な世界最高レベルの性能を持つグラフ探索ソフトウェアの開発に成功しています注1)。
(1)複数のノード間におけるグラフデータの効率的な分割方法
(2)冗長なグラフ探索を削減するアルゴリズム
(3)スーパーコンピュータの大規模ネットワークにおける通信性能の最適化
(4)アルゴリズムの最適なパラメータを実行時に自動探索する機構
「Graph500」のBFS部門における第1位獲得は、「富岳」が科学技術計算でよく用いられる規則的な計算だけでなく、不規則な計算が大半を占めるグラフ解析においても高い性能を発揮することを実証したものであり、幅広い分野のアプリケーションに対応できる「富岳」の優れた汎用性を示すものです。また、ハードウェアの性能を最大限に活用できるソフトウェアを開発した共同研究グループの技術力の高さを示すものでもあります。現在共同研究グループでは「富岳」で処理可能なグラフデータの規模を倍増させるための改良を進めており、今回の測定で得たデータを基に性能改善を加速させていきます。
<関連リンク>
理化学研究所 計算科学研究センター
https://www.r-ccs.riken.jp/jp/
注1)
本研究では以下の成果(アルゴリズムやプログラム)を活用しています。
1: 科学技術振興機構(JST)戦略的創造研究推進事業CREST「ポストペタスケール高性能計算に資するシステムソフトウェア技術の創出(研究総括:佐藤三久)」における研究課題「ポストペタスケールシステムにおける超大規模グラフ最適化基盤(研究代表者:藤澤克樹、拠点代表者:鈴村豊太郎)」
2: 科学技術振興機構(JST)戦略的創造研究推進事業CREST「ビッグデータ統合利活用のための次世代基盤技術の創出・体系化(研究総括:喜連川優)」における研究課題「EBD:次世代の年ヨッタバイト処理に向けたエクストリームビッグデータの基盤技術(研究代表者:松岡聡)」
3. 日本学術振興会
科学研究費助成事業「自動性能チューニング機能を持つ高性能グラフライブラリの開発(研究代表者:中尾昌広、研究分担者:藤澤克樹、児玉祐悦)」
4: 大規模グラフ解析プログラムの GitHubレポジトリ
https://github.com/suzumura/graph500/
<参考文献>
1.Masahiro Nakao, Koji Ueno, Katsuki Fujisawa, Yuetsu Kodama, and Mitsuhisa Sato. “Performance of the Supercomputer Fugaku for Breadth-First Search in Graph500 Benchmark”. ISC High Performance, June 2021, pp. 372-390. https://doi.org/10.1007/978-3-030-78713-4_20
2.Koji Ueno, Toyotaro Suzumura, Naoya Maruyama, Katsuki Fujisawa, Satoshi Matsuoka, ”Efficient Breadth-First Search on Massively Parallel and Distributed Memory Machines”, Data Science and Engineering, Springer, March 2017, Volume 2, Issue 1, pp 22-35, 2017.
3.Koji Ueno, Toyotaro Suzumura, Naoya Maruyama, Katsuki Fujisawa, Satoshi Matsuoka , "Extreme scale breadth-first search on supercomputers". 2016 IEEE International Conference on Big Data (Big Data): 1040–1047. 2016.
3.補足説明
[1] スーパーコンピュータ「富岳(ふがく)」
スーパーコンピュータ「京」の後継機。2020年代に、社会的・科学的課題の解決で日本の成長に貢献し、世界をリードする成果を生み出すことを目的とし、電力性能、計算性能、ユーザーの利便性・使い勝手の良さ、画期的な成果創出、ビッグデータやAIの加速機能の総合力において世界最高レベルのスーパーコンピュータとして2021年3月に共用を開始した。
現在「富岳」は日本が目指すSociety 5.0を実現するために不可欠なHPCインフラとして活用されている。
[2] ノード
スーパーコンピュータにおけるオペレーティングシステムが動作できる最小の計算資源の単位。「富岳」の場合は、一つのCPU(中央演算装置)と32GiB(ギビバイト)のメモリから構成される。
[3] GTEPS(ギガテップス)
TEPSはTraversed Edges Per Secondの略であり、「Graph500」ベンチマークの実行速度を表すスコア。「Graph500」ベンチマークでは与えられたグラフの頂点とそれをつなぐ枝を処理する。「Graph500」におけるコンピュータの速度は1秒間当たりに処理した枝の数として定義されている。GTEPSのGは10の9乗を表し、GTEPSは1秒当たりに処理した枝の数を10の9乗で割った値である。GTEPS値の計算には、64試行における調和平均が使用されている。
[4] Society 5.0
狩猟社会(Society 1.0)、農耕社会(Society 2.0)、工業社会(Society 3.0)、情報社会(Society 4.0)に続く、新たな社会を指すもので、第5期科学技術基本計画において日本が目指すべき未来社会の姿として初めて提唱された。IoT、ロボット、AI(人工知能)、ビッグデータといった社会の在り方に影響を及ぼす新たな技術をあらゆる産業や社会生活に取り入れ、経済発展と社会的課題の解決を両立していく新たな社会の実現を目指す。
[5] 持続可能な開発目標(SDGs)
2015年9月の国連サミットで採択された「持続可能な開発のための2030アジェンダ」にて記載された2016年から2030年までの国際目標。持続可能な世界を実現するための17のゴールと169のターゲットで構成され、発展途上国のみならず、先進国自身が取り組むユニバーサル(普遍的)なものであり、日本も積極的に取り組んでいる。(外務省ホームページから一部改変して転載)