おすすめ製品 [グラフィックボードが使える製品]
「グラフィックボードを使いたい」とお問い合わせをよく頂きます。
・複数画面の表示が行いたい
・画像表示の高速化を行いたい
・監視カメラ映像などのエンコードを高速化したい
また、高速化だけではなくCPUを用いて処理するよりも、CPUの負荷率が下がり、その分、
他の処理を行う事ができる様になることも大きなメリットです。
弊社製品の中で、グラフィックボードが使える製品のハイグレードCD、スリムタワーCDに
ついて、実際に用いたグラフィックボードとそのテスト結果と共にご紹介させて頂きます。
【高性能】
 |
産業用 Xeon E3-1275 v6 3.8GHzを搭載
4コア / 8スレッドに対応し、かつ長期供給を実現したサーバー
クラスの製品です。 |
▼テストに使用したモデルはこちら
型式 |
CPU |
OS |
起動
デバイス |
メモリ |
ビデオ出力 |
LAN |
EWS-KH10A(L8XA)MR02NS21 |
Intel Xeon Processor E3-1275 v6
3.8GHz |
Interface Linux System 8 |
SSD (32GB) |
ECC 64GB |
2 ポート(DisplayPort v1.2, DVI-D) |
4 |
※ その他のラインナップはこちらから
▼テストに使用したグラフィックボードはこちら
メーカー |
型式 |
グラフィックコプロセッサ |
メモリ |
ビデオ出力 |
玄人志向 |
GF-GTX1650D6-E4GB/DF2 |
NVIDIA GeForce GTX 1650 |
GDDR6
4GB |
3 ポート(DisplayPort v1.4, DVI-D,
HDMI 2.0b) |
玄人志向 |
GF-GT1030-E2GB/LP/D5 |
NVIDIA GeForce GT 1030 |
GDDR5
2GB |
2 ポート
(DVI-D,
HDMI 2.0b) |
※ ハイグレードCDで使用できるボードは、使用電力150Wまでの製品をお選び下さい
※ グラフィックボードの形状によっては干渉しますので事前に貸出品でご評価下さい
※ 使用したグラフィックドライバのバージョンは 470.74 です
- 動画エンコード時間
ffmpegを用い、H.264、H.265(HEVC)へのエンコード処理を行い、実行時間を比較して
みます。
動画の品質の違いはここでは見ていませんので、あくまでも処理時間のみの比較です。
使用する動画は こちら で紹介している 「車載CD 信頼性試験レポート」を使用します。
|
H.264 |
H.265(HEVC) |
ソフトエンコード(CPU) |
14.205 |
21.447 |
GTX 1650 |
11.938 |
11.872 |
GT 1030 |
ーーー |
ーーー |
各処理のパラメータは以下の通り
ffmpeg -i src.mp4 -vcodec hevc_nvenc -s 1280x720 dest.mp4
H.264・・・ソフトエンコードは libx264、ハードウェアエンコードは h264_nvenc
H.265・・・ソフトエンコードは libx265、ハードウェアエンコードは hevc_nvenc
GT 1030 は エンコーダ機能を搭載してないので、性能の測定が行なえませんでした。
結果:グラフフィックボード(GTX1650)を使用する事で、1.19倍〜1.4倍の処理時間
の向上が見られました。
- CUDAのデモプログラムでのベンチマーク
CUDA 9.1 をインストールし、デモプログラムの nbody を実行した結果の比較です。
性能を示すものではないと注意書きがありますので、あくまでも参考として掲載致します。
|
実行時間(ms) |
interactions per seconds |
single-precision GFLOP/s
at 20 flops per interaction
|
CPU処理 |
515680.906 |
0.203 |
4.067 |
GTX 1650 |
1013.074 |
103.504 |
2070.087 |
GT 1030 |
3342.592 |
31.151 |
623.018 |
各処理の内容は以下の通り
./nbody -benchmark -numbodies=102400
結果:GTX1650では約500倍、GT1030では約150倍の処理時間の向上が見られました。
- ベンチマーク
Windows 10 IoT Enterprise 2019 LTSC上での結果です。
(使用ドライバは 472.12-desktop-win10-win11-64bit-international-whql.exe)
コラムの こちら でご紹介している CrystalMark 2004R3 でのグラフィック性能の比較
です。
10回行った平均値
|
合計 |
GDI |
D2D |
OGL |
内蔵グラフィック |
79,210 |
20,558 |
6,658 |
51,994 |
GTX 1650 |
111,769 |
22,627 |
26,245 |
62,897 |
GT 1030 |
94,459 |
19,476 |
14,109 |
60,874 |
GDI・・・2D Graphic Device Interface
D2D・・・2D DirectDraw
OGL・・・3D OpenGL
なお、描画処理の内容が軽く、フレームレートが頭打ちとなる為、NVIDIAコントロール
パネルの、垂直同期の設定をオフに変更して実行しています。
結果:GTX1650では1.4倍、GT1030では1.2倍のベンチマークの向上が見られました。
【省スペース】
 |
産業用Intel Corei5 4570TE 2.7GHzを搭載
2コア / 4スレッドに対応。サイズ、性能、電力消費のバランスがとれた製品です。 |
▼テストに使用したモデルはこちら
型式 |
CPU |
OS |
起動
デバイス |
メモリ |
ビデオ出力 |
LAN |
EST-EM11A(L8XA)GF03CS22 |
Intel Corei5 4570TE
2.7GHz |
Interface Linux System 8 |
SSD (32GB) |
ECC 8GB |
2 ポート
(DVI-I,
DVI-D) |
2 |
※ その他のラインナップはこちらから
▼テストに使用したグラフィックボードはこちら
メーカー |
型式 |
グラフィックコプロセッサ |
メモリ |
ビデオ出力 |
玄人志向 |
GF-GT1030-E2GB/LP/D5 |
NVIDIA GeForce GT 1030 |
GDDR5
2GB |
2 ポート
(DVI-D,
HDMI 2.0b) |
※ スリムタワーCDで使用できるボードは、使用電力30Wまでの製品をお選び下さい
※ グラフィックボードの形状によっては干渉しますので事前に貸出品でご評価下さい
※ 使用したグラフィックドライバのバージョンは 470.74 です
- LibreOffice Calcでのベンチマーク
今回使用するGeForce GT 1030には、動画のエンコード機能がありません。その為、動画変換のベンチマークを行うことができませんので、かわりにLibreOfficeのCalcを用いたテストを行います。
LibreOffice CalcはWindowsのExcelと同様のソフトウェアです。OpenCLという機能を用いて、グラフィックボードに処理を肩代わりさせることで高速化を実現することができます。
今回は、吉田 浩平様がインターネットで公開されている「OpenCL test documents for Calc」を用いてベンチマークを実施します。LibreOffice Calcのマクロを使い、各種計算の実行時間を測定するベンチマーク用のシートです。
「Dates Worked.xlsm」、「Ground water daily.xls」、「Stock history.xls」の3種類のシートが用意されていますので、それぞれ「OpenCLを使用しない場合(CPUで処理)」、「OpenCLを使用する場合(GPUで処理)」で各10回実施し、実行時間の平均値を以下に記します。
単位は ms です
|
Dates worked.xlsm |
Ground water daily.xls |
Stock history.xls |
OpenCLを使用しない |
12,572.129 |
26,838.359 |
821.932 |
OpenCLを使用する |
12,556.648 |
18,073.840 |
339.296 |
結果:
Dates worked.xlsmではOpenCLの使用有無での差は見られませんでした。
Ground water daily.xls、Stok history.xlsの2種では大幅な速度向上が見られ
ました。
処理の内容に左右される様ですが、OpenCLを使用する(GPUで処理)ことで一定の
性能向上は見込める様です。
- CUDAのデモプログラムでのベンチマーク
CUDA 9.1 をインストールし、デモプログラムの nbody を実行した結果の比較です。
性能を示すものではないと注意書きがありますので、あくまでも参考として掲載致します。
|
実行時間(ms) |
interactions per seconds |
single-precision GFLOP/s
at 20 flops per interaction
|
CPU処理 |
736814.125 |
0.142 |
2.846 |
GT 1030 |
3102.476 |
33.798 |
675.961 |
各処理の内容は以下の通り
./nbody -benchmark -numbodies=102400
結果:GT 1030を使用することで約240倍の処理時間の向上が見られました。
- ベンチマーク
Windows 10 IoT Enterprise 2016 LTSB上での結果です。
(使用ドライバは 472.12-desktop-win10-win11-64bit-international-whql.exe)
コラムの こちら でご紹介している CrystalMark 2004R3 でのグラフィック性能の比較
です。
10回行った平均値
|
合計 |
GDI |
D2D |
OGL |
内蔵グラフィック |
31,918 |
14,239 |
5,256 |
12,423 |
GT 1030 |
71,595 |
12,520 |
9,567 |
49,508 |
GDI・・・2D Graphic Device Interfac
D2D・・・2D DirectDraw
OGL・・・3D OpenGL
なお、描画処理の内容が軽く、フレームレートが頭打ちとなる為、NVIDIAコントロール
パネルの、垂直同期の設定をオフに変更して実行しています。
結果:GT 1030を使用することで平均2.2倍のベンチマークの向上が見られました。
CUDAは、米国およびその他の国におけるNVIDIA Corporationの商標または登録商標です。
その他、グラフィックボード搭載についてのご相談は こちらから
|