いろいろやってみるにっき

なんとか自分の会社を立ち上げるところまで漕ぎ着けた、てきとーに生きている奴の日記

関連記事を探すときは、読んだ記事と同じカテゴリをクリックしてください。

記事のカテゴリは記事タイトル下に表示されています。カテゴリ一覧はサイドバーにあります。


続 CUDA-ZでCUDAが使えるマシンの情報がわかる

今度は日本語版でやってみた。こっちのほうが見やすい。使うならこちらのほうが良さそう。


日本語版のサイトはこちら。

 

ThinkPad W520

f:id:shigeo-t:20170831005107p:plain

f:id:shigeo-t:20170831005251p:plain

f:id:shigeo-t:20170831005257p:plain

f:id:shigeo-t:20170831005306p:plain

 

ThinkPad W530

f:id:shigeo-t:20170831005340p:plain

f:id:shigeo-t:20170831005345p:plain

f:id:shigeo-t:20170831005349p:plain

はじめてのCUDAプログラミング―驚異の開発環境[GPU+CUDA]を使いこなす! (I・O BOOKS)

はじめてのCUDAプログラミング―驚異の開発環境[GPU+CUDA]を使いこなす! (I・O BOOKS)

 

 

比較表

Performanceタブから[Export >>]でデータがExportできる。クリップボードやHTML形式も選択できるが、今回は双方txt形式にして比較表を作成した。

  ThinkPad W520 ThinkPad W530
OS Version:  Windows x86 6.2.9200  Windows x86 6.2.9200 
Driver Version:  382.05 382.05
Driver Dll Version: 8.0 (6.14.13.8205) 8.0 (6.14.13.8205)
Runtime Dll Version:  7.0 7.0
Name:  Quadro 2000M Quadro K2000M
Compute Capability:  2.1 3.0
Clock Rate:  1100 MHz 745 MHz
PCI Location:  0:1:0 0:1:0
Multiprocessors:  4 (192 Cores) 2 (384 Cores)
Threads Per Multiproc.:  1536 2048
Warp Size:  32 32
Regs Per Block:  32768 65536
Threads Per Block:  1024 1024
Threads Dimensions: 1024 x 1024 x 64 1024 x 1024 x 64
Grid Dimensions:  65535 x 65535 x 65535 2147483647 x 65535 x 65535
Watchdog Enabled:  Yes Yes
Integrated GPU No No
Concurrent Kernels:  Yes Yes
Compute Mode:  Default Default
Stream Priorities:  No No
Total Global:  2048 MiB 2048 MiB
Bus Width:  128 bits 128 bits
Clock Rate:  900 MHz 900 MHz
Error Correction:  No No
L2 Cache Size:  48 KiB 48 KiB
Shared Per Block:  48 KiB 48 KiB
Pitch:  2048 MiB 2048 MiB
Total Constant:  64 KiB 64 KiB
Texture Alignment:  512 B 512 B
Texture 1D Size:  65536 65536
Texture 2D Size:  65536 x 65535 65536 x 65535
Texture 3D Size:  2048 x 2048 x 2048 4096 x 4096 x 4096
GPU Overlap:  Yes Yes
Map Host Memory:  Yes Yes
Unified Addressing:  Yes Yes
Async Engine:  Yes, Unidirectional Yes, Unidirectional
Host Pinned to Device:  6136.08 MiB/s 6109.58 MiB/s
Host Pageable to Device:  2702.08 MiB/s 3527.56 MiB/s
Device to Host Pinned:  5944.65 MiB/s 5411.91 MiB/s
Device to Host Pageable:  3004.21 MiB/s 3241.14 MiB/s
Device to Device:  11.7847 GiB/s 11.2967 GiB/s
Single-precision Float: 409.485 Gflop/s 461.81 Gflop/s
Double-precision Float:  35.1631 Gflop/s 23.1076 Gflop/s
64-bit Integer:  33.8002 Giop/s 23.8274 Giop/s
32-bit Integer:  139.531 Giop/s 95.1034 Giop/s
24-bit Integer:  139.23 Giop/s 95.0627 Giop/s

性能的には意外とQuadro 2000MがK2000Mに劣るわけでも無さそう。ベンチマークでは確実にQuadro K2000Mのほうが良いが。