いろいろやってみるにっき

てきとーに生きている奴の日記

古いエントリのサムネイル画像がリンク切れになってたりするけど、チマチマ修正中


続 CUDA-ZでCUDAが使えるマシンの情報がわかる

今度は日本語版でやってみた。こっちのほうが見やすい。使うならこちらのほうが良さそう。


日本語版のサイトはこちら。

 

ThinkPad W520

f:id:shigeo-t:20170831005107p:plain

f:id:shigeo-t:20170831005251p:plain

f:id:shigeo-t:20170831005257p:plain

f:id:shigeo-t:20170831005306p:plain

 

ThinkPad W530

f:id:shigeo-t:20170831005340p:plain

f:id:shigeo-t:20170831005345p:plain

f:id:shigeo-t:20170831005349p:plain

はじめてのCUDAプログラミング―驚異の開発環境[GPU+CUDA]を使いこなす! (I・O BOOKS)

はじめてのCUDAプログラミング―驚異の開発環境[GPU+CUDA]を使いこなす! (I・O BOOKS)

 

 

比較表

Performanceタブから[Export >>]でデータがExportできる。クリップボードやHTML形式も選択できるが、今回は双方txt形式にして比較表を作成した。

  ThinkPad W520 ThinkPad W530
OS Version:  Windows x86 6.2.9200  Windows x86 6.2.9200 
Driver Version:  382.05 382.05
Driver Dll Version: 8.0 (6.14.13.8205) 8.0 (6.14.13.8205)
Runtime Dll Version:  7.0 7.0
Name:  Quadro 2000M Quadro K2000M
Compute Capability:  2.1 3.0
Clock Rate:  1100 MHz 745 MHz
PCI Location:  0:1:0 0:1:0
Multiprocessors:  4 (192 Cores) 2 (384 Cores)
Threads Per Multiproc.:  1536 2048
Warp Size:  32 32
Regs Per Block:  32768 65536
Threads Per Block:  1024 1024
Threads Dimensions: 1024 x 1024 x 64 1024 x 1024 x 64
Grid Dimensions:  65535 x 65535 x 65535 2147483647 x 65535 x 65535
Watchdog Enabled:  Yes Yes
Integrated GPU No No
Concurrent Kernels:  Yes Yes
Compute Mode:  Default Default
Stream Priorities:  No No
Total Global:  2048 MiB 2048 MiB
Bus Width:  128 bits 128 bits
Clock Rate:  900 MHz 900 MHz
Error Correction:  No No
L2 Cache Size:  48 KiB 48 KiB
Shared Per Block:  48 KiB 48 KiB
Pitch:  2048 MiB 2048 MiB
Total Constant:  64 KiB 64 KiB
Texture Alignment:  512 B 512 B
Texture 1D Size:  65536 65536
Texture 2D Size:  65536 x 65535 65536 x 65535
Texture 3D Size:  2048 x 2048 x 2048 4096 x 4096 x 4096
GPU Overlap:  Yes Yes
Map Host Memory:  Yes Yes
Unified Addressing:  Yes Yes
Async Engine:  Yes, Unidirectional Yes, Unidirectional
Host Pinned to Device:  6136.08 MiB/s 6109.58 MiB/s
Host Pageable to Device:  2702.08 MiB/s 3527.56 MiB/s
Device to Host Pinned:  5944.65 MiB/s 5411.91 MiB/s
Device to Host Pageable:  3004.21 MiB/s 3241.14 MiB/s
Device to Device:  11.7847 GiB/s 11.2967 GiB/s
Single-precision Float: 409.485 Gflop/s 461.81 Gflop/s
Double-precision Float:  35.1631 Gflop/s 23.1076 Gflop/s
64-bit Integer:  33.8002 Giop/s 23.8274 Giop/s
32-bit Integer:  139.531 Giop/s 95.1034 Giop/s
24-bit Integer:  139.23 Giop/s 95.0627 Giop/s

性能的には意外とQuadro 2000MがK2000Mに劣るわけでも無さそう。ベンチマークでは確実にQuadro K2000Mのほうが良いが。

 

お時間あったら、他のエントリもクリックして頂ければ幸いです。