GPGPU (General Purpose Graphics Processing Unit)


GPGPU、もしくはそれを用いたGPUコンピューティングとは、従来は画像処理に利用されていたGPU(Graphics Processing Unit)の演算性能を、画像処理以外の汎用的な処理に応用しようというものです。

弊社では、NVIDIA社と提携し、HPC分野でGPGPUを活用したいというお客様の要望に応えていきます。

NVIDIAメーカーサイトへ

※評価機の貸し出しを行っています。メール:sales@bestsystems.co.jp にて問い合わせください。

※ご要望に応じてカスタマイズ可能です。お気軽にお問い合わせ下さい。

直感的な並列プログラミング環境を提供するCUDAをサポート

CUDAは、従来のC言語でプログラミングが可能な並列コンピューティングアーキテクチャです。GPUを用いた並列演算をハイパフォーマンスで実行できます。将来的には、FORTRANやC++といった他の言語もサポートされる予定です。CUDA ZONEでは100件を超えるCUDAの研究成果や採用事例が紹介されています。

取り扱いGPU製品


NVIDIA Tesla C2050 / C2070 コンピューティングプロセッサボード

次世代CUDA GPUアーキテクチャ
Fermiプロセッサを搭載した、
最新GPUコンピューティングプロセッサボード
製品名 NVIDIA Tesla C2050 NVIDIA Tesla C2070
搭載GPU数 1基
CUDAコア数 448基
CUDAコア周波数 1.15GHz
単精度演算性能 1.03TFlops
倍精度演算性能 515GFlops
搭載メモリ容量 ※1 3GB 6GB
メモリスピード 1.5GHz
メモリインターフェース GDDR5 SDRAM 384bit
メモリ帯域幅 144GB/sec
消費電力 247W (TDP)
価格 オープン価格
※1 注意:ECCを有効にすると、専用メモリの一部はECCビットに使用され、使用可能なユーザメモリは12.5%減少します。

Tesla C2050 性能比較

〔上段左から右へ〕Mini DGコードを使った不連続Galerkin法による偏微分方程式の解/AMBERによる分子動力学シミュレーション(混合精度型)/OpenCurrentによるLock-exchange problemの流体シミュレーション/OpenEye社製ROCSによる仮想薬剤スクリーニング/CUDA SDKにおける基数ソート
〔下段左から右へ〕(標準FFT(高速フーリエ変換)ライブラリによる)単精度FFT/倍精度FFT


NVIDIA Tesla S2050 コンピューティングシステム

次世代CUDA GPUアーキテクチャ
Fermiプロセッサを4基搭載。
1UラックサイズのGPUコンピューティングサーバ
製品名 NVIDIA Tesla S2050
搭載GPU数 4基
GPUメモリスピード 1.55GHz
GPUメモリインターフェース GDDR5 SDRAM 384bit
GPUメモリ帯域幅 148GB/sec
単精度演算性能 (ピーク時) 4.13TFlops
倍精度演算性能 (ピーク時) 2TFlops
搭載メモリ容量 ※1 12GB (3GB×4)
消費電力(標準) 900W (TDP)
価格 オープン価格
※1 注意:ECCを有効にすると、専用メモリの一部はECCビットに使用され、使用可能なユーザメモリは12.5%減少します。


NVIDIA Tesla C1060 コンピューティングプロセッサボード

大容量超高速のGDDR3メモリを4GB搭載。
HPC用途に特化した
GPUコンピューティングプロセッサボード
製品名 NVIDIA Tesla C1060
搭載GPU数 1基
CUDAコア数 240基
プロセッサコア周波数 1.296GHz
単精度演算性能 933GFlops
倍精度演算性能 78GFlops
搭載メモリ 4GB
メモリインターフェース GDDR3 SDRAM 512bit
浮動小数点精度 IEEE754 単精度および倍精度浮動小数点
メモリ転送帯域 102GB/sec
TDP 225W
最大消費電力 187.8W
価格 オープン価格

Tesla C1060 性能比較

〔上段左から右へ〕ジャケットプラグインを使用したMatlabによるBlack-Scholes シミュレーションの高速化/CUDA SDKにおける乱数生成器/SciFinanceによるMonte Carlo価格計算
〔下段左から右へ〕CUDAを利用したWRF(メソスケール気象モデル)の高速化/GPUを用いたHMMERの高速化


NVIDIA Tesla S1070 GPUコンピューティングシステム

4基のGPUと合計16GBのGDDR3メモリを搭載。
HPC用途に特化した
GPUコンピューティングサーバ
Tesla S1070は、Tesla C1060を4基搭載した1Uサーバ型フォームファクターです。高いパフォーマンスが要求される処理においても、エネルギー効率のよい並列コンピューティングが実行できます。PCI-express x 16 Generation 2バス接続用ポートを2つ備え、それぞれに2基のGPUが接続されます。ホストシステム2台でTesla S1070を共有して使用することも可能です。
製品名 NVIDIA Tesla S1070-400 NVIDIA Tesla S1070-500
形状 ラックマウント(1U)タイプ
搭載GPU数 4基
CUDAコア数 合計960基 (各GPUに240基)
プロセッサ周波数 1.296GHz 1.44GHz
単精度演算性能 4.147TFlops 3.732TFlops
倍精度演算性能 311GFlops 345GFlops
搭載メモリ 16GB (各GPUに4GB)
浮動小数点精度 IEEE754 単精度および倍精度浮動小数点
メモリインターフェース GDDR3 SDRAM 512bit
メモリ転送帯域 1GPUあたり、102GB/sec
消費電力 アイドル時:500 W
最大消費電力:1123W
標準付属ホストカード:10W
価格 オープン価格