Maxwell は DirectX12 の Async Compute のパフォーマンスが悪い?

カテゴリ:programming

WCCF TECH の記事 によると,Maxwell は Async Compute をコンテキストスイッチを使って実装している;コンテキストスイッチとは実行するスレッドを切り替えるためにスレッドの情報を保存/リストアする工程のことだ;シングルコアの CPU がマルチタスクを実行するときもこのコンテキストスイッチを行っている.コンテキストスイッチは遅い処理なので Maxwell は AMD の GCN に比べて Async Compute のパフォーマンスが悪いということらしい.

公開されたベンチでは確かにパフォーマンスが悪い.しかしその原因がコンテキストスイッチであるというソースは見つからなかった.

[Analysis] Async Compute - is it true nVidia can't do it? では自作のベンチを作成し,Maxwell でも work order limit(1+31 queue) の範囲内なら十分速いと結論付けている.