SPIR-V

はじめに

SPIR-Vの概要と背景

SPIR-V (Standard Portable Intermediate Representation)は、汎用的な中間表現形式です。もともとは、Khronos Groupによって策定された次世代グラフィックスAPIである「Vulkan」で利用されることを目的に開発されました。しかし、その汎用性の高さから、近年では機械学習、汎用GPU計算(GPGPU)、レイトレーシングなど、幅広い分野で活用されるようになってきました。

SPIR-Vは、CPUアーキテクチャに依存しないバイナリ形式で、様々なグラフィックスAPI(OpenGL、Vulkan、DirectX)やコンピューティングAPIにおける中間表現として機能します。つまり、SPIR-VはあらゆるGPUベンダーで動作可能な、ポータブルな中間表現なのです。

SPIR-Vは、OpenCL C、OpenGL/Vulkan GLSL、HLSL(DirectXシェーダー言語)などのグラフィックスやコンピューティングのソースコードから生成できます。生成されたSPIR-Vバイナリは、GPUドライバによって特定のGPUアーキテクチャ向けのネイティブコードにコンパイルされ実行されます。

利用シーンと利点

SPIR-Vの主な利用シーンとして以下のようなものがあります。

グラフィックスレンダリング: SPIR-Vは、Vulkanをはじめとする次世代グラフィックスAPIにおいて、シェーダープログラムの中間表現として機能します。従来のレンダリングパイプラインをベースとしたアプリケーションはもちろん、レイトレーシングなどの新しいレンダリング手法にも対応しています。
GPGPU(汎用GPU計算): CPUだけでなく、GPUの並列処理能力を活用してデータ処理を高速化するGPGPUにも適しています。機械学習のニューラルネットワークなどの並列計算ワークロードを効率的に実行できます。
ポータビリティ: SPIR-Vはハードウェアに依存しない中間表現なので、あらゆるGPUベンダーのハードウェア上で実行可能です。これにより、ベンダーロックインを避けられ、移植性が高まります。
階層的な最適化: SPIR-Vは、ソースコードからSPIR-V中間表現を経由し、最終的にGPUのネイティブコードへと変換されます。この過程で、中間表現レベル、およびバックエンド最適化レベルの両方で最適化が行えます。
デバッグ性: SPIR-Vは人間が読み書きできる中間表現なので、デバッグがしやすくなります。GPUネイティブコードを直接扱うよりも、プログラマにとって理解しやすいです。

このように、SPIR-Vは次世代のグラフィックス/コンピューティングAPIにおいて中心的な役割を果たすだけでなく、ポータビリティやデバッグ性の面でも大きなメリットをもたらします。本書では、SPIR-Vの基礎から実践的な活用まで解説していきます。

SPIR-V言語の基礎

SPIR-Vは、GPUで実行されるシェーダープログラムやコンピュートカーネルをコーディングするための中間表現です。その構文は低レベルですが、構造化されており、高水準言語からコンパイルされたものを人間が読み書きできる形式になっています。

構文と命令セット

SPIR-Vのプログラムは、ヘッダと一連の命令で構成されています。ヘッダにはバージョン、アドレス空間の扱い、言語の機能セットなどのメタデータが含まれます。

; ヘッダ
OpCapability Shader
OpMemoryModel Logical Simple

; 関数の定義
OpEntryPoint GLCompute %main "main"

; メイン関数
OpName %main "main"
%main = OpFunction %void None ...

命令は Op[命令名] という形式で記述され、パラメータを取ることもできます。基本的な命令セットには以下のようなものがあります。

OpConstant*：定数の定義
Op*：算術演算、ビット演算などの基本操作
OpLoad、OpStore：メモリアクセス
OpAccessChain：構造体やベクトル/行列への部分アクセス
OpBranch*：条件分岐やループ
OpFunctionCall：関数呼び出し

さらに、シェーダーの種類に応じて特化された命令セットが用意されています。例えばVertexIDやInstanceIDをアクセスするためのOpXXXID命令などがあります。

データ型と変数

SPIR-Vには、浮動小数点数、整数、ベクトル、行列、構造体、ポインタといった基本データ型が用意されています。これらはグラフィックス/コンピューティングに特化した型で、OpenCLやGLSLなどの言語に由来しています。

%float = OpTypeFloat 32
%vec3 = OpTypeVector %float 3
%mat4x4 = OpTypeMatrix %vec4 4

%i32 = OpTypeInt 32 1 ; 符号付き32ビット整数
%u32 = OpTypeInt 32 0 ; 符号なし32ビット整数

%_struct_name = OpTypeStruct %vec3 %float ...

変数の宣言や定義は以下のように行います。

%my_vec3 = OpVariable %_ptr_vec3 Function
%my_mat4x4 = OpVariable %_ptr_mat4x4 Private ...

ポインタ型を使って、アクセス修飾子(Private、Function、Input、Outputなど)も指定できます。

制御フロー構造

SPIR-Vの制御構造は、構造化されたブロック形式になっています。これは、WebGPUやHLSLなどの現代的なシェーディング言語と同様のアプローチです。

OpBranch %check_loop_condition

%check_loop_condition = OpLabel
%still_looping = ...
OpLoopMerge %loop_merge ...
OpBranchConditional %still_looping %loop_body %loop_merge

%loop_body = OpLabel
  ... ; ループ本体
  OpBranch %check_loop_condition

%loop_merge = OpLabel
  ... ; ループ後の処理

条件分岐も同様に、まずヘッダブロック、次に条件ブロック、true/falseのケースブロックという構造になります。これらのブロック構造は、制御フローを明示的かつ構造化された形で表現するのに適しています。

関数とスコープ

SPIR-Vでは、プログラムの論理的な構造化や再利用性を高めるため、関数を定義できます。

%algebraic_vector_mul = OpFunction %vec3 ...
  ... ; 関数本体
  OpReturnValue %result
OpFunctionEnd

関数の引数とリターン値の型を指定し、OpFunctionCallで呼び出します。また、変数のスコープ(Private、Function、Input、Outputなど)を指定できるので、名前空間の衝突を防げます。

スコープには、非常に軽量なプライベート領域とグローバル領域があり、レジスタ割り当てなどの最適化が可能になっています。シェーダープログラムでは、このスコープを適切に活用し、GPUのレジスタ使用効率を高めることが重要です。

以上が、SPIR-V言語の基礎的な仕組みです。低レベルな構文ですが、これらの概念を理解することで、SPIR-Vコードを効率的に記述し、GPU上で実行できるようになります。

シェーダーの記述

SPIR-Vでシェーダープログラムを記述する際は、シェーダーの種類に応じて、入出力インターフェース、利用可能な機能セット、処理の流れが異なります。ここでは、主要なシェーダータイプごとに、SPIR-V記述の具体例を示します。

頂点シェーダー

頂点シェーダーは、頂点データを処理し、頂点の位置や属性を計算します。入力は頂点バッファから読み込まれ、出力は次のシェーダーステージに渡されます。

; 頂点シェーダーのエントリポイント
OpEntryPoint Vertex %main "main" %gl_PerVertexData ...

; 入力: 頂点バッファからの属性
%gl_PerVertexData = OpVariable %_ptr_input_PerVertexData Input

%main = OpFunction %void None ...
%entry_point_params = OpFunctionParameter %gl_PerVertexData
%position_ptr = OpAccessChain %_ptr_vec4 Input %gl_PerVertexData %position_idx
%in_position = OpLoad %vec4 %position_ptr

; 頂点変換行列を用いた頂点座標の変換
...
%out_position = OpVectorTimesMatrix %vec4 ...

; 出力: 次のシェーダーステージへの出力
%output_ptr = OpAccessChain %_ptr_output_vec4 %gl_Position ...
OpStore %output_ptr %out_position

OpReturn
OpFunctionEnd

頂点シェーダーでは、頂点データをロードし、座標変換や他の処理を行った後、次のステージに出力データを渡します。

フラグメントシェーダー

フラグメントシェーダーは、ラスタライズされたフラグメントのデータを処理し、そのピクセルの色を計算します。

; フラグメントシェーダーのエントリポイント 
OpEntryPoint Fragment %main "main" %gl_FragCoord ...

; 入力：フラグメント座標やテクスチャ座標など
%gl_FragCoord = OpVariable %_ptr_input_vec4 Input

%main = OpFunction ...

; フラグメントの色を計算
%coord = OpLoad %vec4 %gl_FragCoord
%uv = OpVectorShuffle %vec2 %coord ...
%tex_color = OpImageSample %vec4 ...
%diffuse_light = ...
%out_color = OpVectorMultiply %vec4 %tex_color %diffuse_light

; 出力: 最終的なピクセル色
OpStore %gl_FragColor %out_color

OpReturn
OpFunctionEnd

フラグメントシェーダーでは、フラグメント座標からUV座標を計算し、テクスチャ色とライティング計算を組み合わせてピクセルの最終色を出力します。

ジオメトリシェーダー

ジオメトリシェーダーは、プリミティブストリームを入力として受け取り、新しいプリミティブを生成したり既存のプリミティブを破棄できます。

; ジオメトリシェーダーのエントリポイント
OpEntryPoint Geometry %main "main" %gl_in %gl_out ...

; 入力: 入力プリミティブのストリーム
%gl_in = OpVariable %_ptr_input_struct ...  

%main = OpFunction ...

%in_primitives = OpLoad %input_primitives %gl_in
...
; プリミティブの生成・破棄処理
%new_primitives = ...

; 出力: 新しいプリミティブストリーム
OpStore %gl_out %new_primitives

OpReturn
OpFunctionEnd

ジオメトリシェーダーは、プリミティブストリームを受け取り、ジオメトリ処理を行った上で新しいプリミティブストリームを生成します。

コンピュートシェーダー

コンピュートシェーダーは、並列データ処理に特化したシェーダータイプです。スレッドグループが並列でディスパッチされ、各スレッドがデータの一部を処理します。

; コンピュートシェーダーのエントリポイント
OpEntryPoint GLCompute %main "main" %gl_GlobalInvocationID

; 入力: グローバル領域のスレッドID
%gl_GlobalInvocationID = OpVariable %_ptr_input_vec3 Input

%main = OpFunction ...  
%thread_id = OpLoad %vec3 %gl_GlobalInvocationID

; スレッドIDからデータ処理のインデックスを計算
%idx = ...

; データ処理 (例: 画像フィルタ適用)
%in_color_ptr = OpAccessChain %_ptr_vec4 %in_image %idx 
%in_color = OpLoad %vec4 %in_color_ptr   
%filtered = OpFilter %vec4 %in_color
%out_color_ptr = OpAccessChain %_ptr_vec4 %out_image %idx
OpStore %out_color_ptr %filtered

OpReturn 
OpFunctionEnd

コンピュートシェーダーでは、グローバル領域のスレッドIDを入力し、そのスレッドIDに基づいてデータの並列処理を行います。画像フィルタ適用のようなデータ並列タスクに適しています。

このように、SPIR-Vでは様々なシェーダータイプに対応しており、シェーダープログラムの入出力インターフェースやデータアクセス、制御フローなどを記述できます。高レベルシェーディング言語からSPIR-Vにコンパイルすれば、GPU上で実行可能な中間表現が得られます。

メモリアクセスとバッファ

SPIR-Vでは、様々なメモリオブジェクトとアクセス手段が用意されており、効率的なデータ転送や並列処理が可能になっています。ここでは主要なメモリオブジェクトの種類と使い方を説明します。

ユニフォームバッファ

ユニフォームバッファは、シェーダーにデータを渡すための一般的な手段です。CPUからGPUへデータをアップロードし、シェーダープログラム内から読み取ることができます。

; ユニフォームバッファ宣言
%shader_data = OpTypeStruct %mat4 %vec4 ...
%uni_buf = OpVariable %_ptr_uniform_shader_data Uniform

%main = OpFunction ...

; ユニフォームバッファからデータを読み込む
%uni_ptr = OpAccessChain %_ptr_mat4 %uni_buf %idx_model
%model = OpLoad %mat4 %uni_ptr

...

OpReturn
OpFunctionEnd

ユニフォームバッファは、頂点やフラグメントシェーダーにおいて、モデル変換行列やマテリアルデータ、レンダリングパラメータなどを渡すのに適しています。

ストレージバッファ

ストレージバッファは、シェーダープログラムから読み書きができるメモリオブジェクトです。GPUの並列処理能力を生かして、バッファデータを効率的に処理できます。

; ストレージバッファ宣言
%buffer_data = OpTypeStruct %vec4
%storage_buf = OpVariable %_ptr_ssbo_buffer_data StorageBuffer

%main = OpFunction ...  

; グローバルインデックスからストレージバッファのアドレスを取得
%gidx = ... 
%buf_ptr = OpAccessChain %_ptr_vec4 %storage_buf %gidx

; ストレージバッファの読み書き
%val = OpLoad %vec4 %buf_ptr
%new_val = OpVectorMultiply %vec4 %val ...
OpStore %buf_ptr %new_val

OpReturn
OpFunctionEnd

ストレージバッファは、コンピュートシェーダーにおける並列データ処理や、転送フィードバック機構などに活用されます。

イメージ/テクスチャ

GPUのテクスチャユニットを介して、イメージやテクスチャデータにアクセスすることができます。フィルタリングや色変換なども可能です。

; テクスチャイメージ宣言  
%img_tex = OpVariable %_ptr_image_type Image

%main = OpFunction ...

; 座標からテクスチャを読み込む  
%coord = OpBitcast %vec4 %input_coords
%rgba_val = OpImageSample %vec4 %img_tex %coord

; フィルタ処理を行う
%filtered = OpFilter %vec4 %rgba_val 

; 書き込み可能なイメージへ出力
%out_img_ptr = OpAccessChain %_ptr_image_type %output_image ...
OpImageWrite %out_img_ptr %coord %filtered  

OpReturn
OpFunctionEnd

イメージやテクスチャは、レンダリングシェーダーにおいてマッピングやライティングに使われるほか、コンピュートシェーダーでの画像処理にも活用できます。

アトミック操作

アトミック操作を使うと、複数のスレッド間で競合が発生する可能性のあるメモリ位置への並列アクセスを安全に実行できます。

%counter_var = OpVariable %_ptr_uint CounterMemory

%main = OpFunction ...

%idx = ... 
%ptr = OpAccessChain %_ptr_uint %counter_var %idx

; アトミックにカウンターをインクリメント
%old_val = OpAtomicIAdd %uint %ptr %uint_1 ...

OpReturn
OpFunctionEnd

アトミック加算、ビットwise AND/OR、最小/最大値の取得などの命令が用意されています。これらはコンピュートシェーダーでの並列処理やリダクション計算などに使われます。

このように、SPIR-Vではメモリオブジェクトの種類に応じて、適切なインターフェースやアクセス手段が提供されています。メモリアクセスのパターンに合わせてこれらを活用することで、効率的なGPU計算が実現できます。

レイトレーシング

レイトレーシングは、光線の経路を追跡することで高品質な画像レンダリングを実現する手法です。SPIR-Vは、Vulkanなどの次世代APIにおけるレイトレーシングのプログラミングをサポートしています。

レイトレーシングパイプライン

レイトレーシングでは、従来のレンダリングパイプラインとは異なる専用のパイプラインが使用されます。

; レイトレーシングパイプラインの構築
%pipeline = OpCreateRayTracingPipeline ...

; シェーダーの割り当て
OpSetRayTracingShaderGroup %pipeline ... %ray_gen ...
OpSetRayTracingShaderGroup %pipeline ... %ray_miss ...  
OpSetRayTracingShaderGroup %pipeline ... %ray_hit ...

; トレースレイのディスパッチ
%sbt = OpCreateShaderBindingTable %pipeline ...
OpTraceRays %sbt ...

レイトレーシングパイプラインには、レイジェネレーションシェーダー、レイミスシェーダー、レイヒットシェーダーなどの専用シェーダーが割り当てられます。これらは、シェーダーバインディングテーブル(SBT)を介してディスパッチされます。

レイジェネレーションシェーダー

レイジェネレーションシェーダーは、各ピクセルに対して一本以上のレイ(光線)を生成する役割を持ちます。

%rayGenShader = OpFunction ...

%launch_size = ...
%idx = OpGetGlobalInvocationID ... 
%uv = OpVectorLoad ... ; ピクセル座標 (u,v) を計算

; 光線を生成してトレース    
%ray = OpCreateRay ...
%payload = OpCreatePayloadData ...  
OpTraceRay %ray %payload ... %rayHit %rayMiss
 
; ピクセル色などをイメージへ書き込む
OpImageWrite %output %idx %color

OpReturn
OpFunctionEnd

レイジェネレーションシェーダーは、ピクセルのUV座標から視線ベクトルを計算し、カメラ位置を始点とする光線を作成します。その後、その光線をレイトレースし、ヒットやミスのシェーダーを呼び出します。

レイヒットシェーダー

レイがジオメトリに交差したときに呼び出されるシェーダーがレイヒットシェーダーです。交差点での色やシェーディングを計算します。

%rayHitShader = OpFunction ...  

; レイと三角形の交差情報を取得
%hit = OpGetIntersectionInfo ...  

; シェーディング・ライティングの計算
%vtx_data = OpLoadVertexData ...
%normal = OpCalculateNormal ...
%diffuse = OpDiffuseLight %normal ...

; レイペイロードへ色を設定
%ray_payload = OpGetPayloadData ...
OpStoreRayPayload %ray_payload %diffuse

; 反射レイや透過レイを再度トレースする場合の処理
%reflected = OpReflect ...
OpTraceRay %reflected ...

OpReturn  
OpFunctionEnd

レイヒットシェーダーでは、交差点での法線や材質データを取得し、ライティングモデルに基づいた色を計算します。さらに、反射や屈折を考慮して新しいレイを発射することもできます。

レイミスシェーダー

レイが何の物体とも交差しなかった場合に呼び出されるのがレイミスシェーダーです。背景色や環境マップなどを設定します。

 
%rayMissShader = OpFunction ...

; レイミスの種類を判定
%miss = OpGetMissType ...

; 背景色や環境マップを設定  
%sky_color = ...
%ray_payload = OpGetPayloadData ...
OpStoreRayPayload %ray_payload %sky_color  

OpReturn
OpFunctionEnd

レイミスシェーダーは、レイが物体に衝突しなかった際に、適切な背景色などを設定する役割を持ちます。

このように、SPIR-Vではレイトレーシングパイプラインを構築し、専用のシェーダーを組み合わせることで、高品質なレイトレーシングレンダリングが実現できます。レイの生成、ヒット処理、ミス処理など、各処理ステップに対応したシェーダーを記述します。

パフォーマンスとデバッグ

GPUでのコードの実行パフォーマンスを確保することは非常に重要です。また、デバッグ作業を適切に行うことで、バグの原因を特定し、コードを最適化しやすくなります。

パフォーマンス最適化のヒント

SPIR-Vコードのパフォーマンス最適化については、以下のようなヒントがあります。

レジスタ使用の最小化

頂点やフラグメントシェーダーでは、レジスタ使用量を最小限に抑えることが重要です。大量の変数を同時に使うと、レジスタ不足によるパフォーマンス低下が発生します。変数のスコープを適切に設定し、不要な一時変数を排除しましょう。

メモリアクセスの最適化

ストレージバッファやイメージへのアクセスは、キャッシュを意識する必要があります。連続したアクセスを行うことで、キャッシュヒット率を高められます。計算とメモリアクセスを分離し、アクセスパターンを工夫しましょう。

ベクトル/SIMD処理の活用

SPIR-Vには、ベクトル型や行列型が備わっています。これらをうまく活用することで、SIMD命令を効率的に発行でき、スカラコードよりも高速になります。幾何変換などのベクトル演算は特にSIMD化に適しています。

分岐とループの最適化

分岐やループの多用は、パフォーマンス低下の原因になります。分岐を減らすために、データ並列手法を取り入れたり、ループアンロールのようなコンパイラ最適化を有効にしたりすることをおすすめします。

コンパイラ最適化の利用

SPIR-Vのコンパイラには、様々な最適化パスが用意されています。中間表現レベルとバックエンド最適化レベルの両面で、アグレッシブな最適化を適用することでパフォーマンスが向上する可能性があります。

プロファイリングとホットスポット最適化

プロファイリングツールを用いて、ホットスポットとなっている部分を特定し、そこを集中的に最適化すると効果的です。トレードオフがあれば、ホットな部分を優先すべきです。

デバッグとプロファイリング

SPIR-Vのデバッグやプロファイリングは、対応したツールやデバッガを使うと容易になります。

SPIR-Vデバッガ: SPIR-Vデバッガを使うと、中間表現レベルでブレークポイントを設定したり、変数の値を確認したりできます。開発環境に統合されているデバッガを利用すると便利です。
グラフィックデバッガ: GPU上でのレンダリング結果を可視化し、ピクセル単位でデバッグができるグラフィックデバッガも重要なツールです。GPUレジスタの値を読み取ったり、波形を確認したりできます。
プロファイラ: 計算パフォーマンスをプロファイルするツールも提供されています。GPUカウンタに基づいてパイプラインの瓶頸を発見したり、待ち時間の原因を特定したりできます。
レンダリングコストの分析: シェーダーのレンダリングコストを解析するツールもあります。命令ごとの分析が可能で、どのシェーダーのどの部分が高コストなのかを特定できます。
デバッグストリーム: デバッグ出力を行うための手段として、デバッグストリームを活用することもできます。ここに文字列や値を出力しておけば、開発中のデバッグに役立ちます。

このようなツール類を活用し、デバッグ作業を円滑に進めるとともに、ホットスポットを見つけ出してパフォーマンスの最適化を行うことが大切です。SPIR-Vの開発では、パフォーマンス確保のための様々な工夫が求められます。

開発ツールとフレームワーク

SPIR-Vを活用するためには、さまざまな開発ツールやフレームワークが提供されています。ここではそれらの概要を説明します。

SPIR-Vコンパイラ

高水準シェーディング言語のコードからSPIR-V中間表現を生成するコンパイラが複数存在します。

SPIR-V-Cross: Khronos公式のクロスコンパイラで、GLSL、HLSLなどの様々な言語からSPIR-Vへのクロスコンパイルをサポートしています。反対にSPIR-VからGLSLなどへの変換も可能です。
glslang: Khronos公開のGLSLからSPIR-Vへのフロントエンドコンパイラです。Vulkanの公式SDKに同梱されています。様々な最適化パスが用意されており、SPIR-Vの生成とリフレクション機能があります。
DXC: DirectXShader Compilerは、MicrosoftがHLSLからSPIR-VやDXILへのコンパイルをサポートする公開コンパイラです。Vulkan、Direct3D 12、WebGPUなどに対応しています。
pathtracerコンパイラ: AMD製のSPIR-Vコンパイラで、OpenCLカーネルからSPIR-V中間表現を生成できます。パストレーサプロジェクトからフォークされています。

これらのコンパイラを使うことで、様々な高水準シェーディング言語からSPIR-Vのバイナリを生成し、最新のGPUで実行することが可能になります。

グラフィックスAPI統合

SPIR-VはさまざまなグラフィックスAPIに統合されています。

Vulkan: Vulkanは、SPIR-Vをネイティブで取り扱いできる設計になっています。SPIR-Vバイナリを直接ドライバにロードしてシェーダを実行します。
Metal: AppleのMetal APIでは、SPIR-VバイナリをMetal Shading Languageに変換してからGPUへ送る方式が採用されています。
Direct3D 12: Direct3D 12では、DXILというSPIR-V由来の中間表現を用いています。DXILコードはドライバ側でネイティブコードに翻訳されます。
WebGPU: WebブラウザのWebGPUは、SPIR-Vを直接取り扱うことで、ポータブルなGPUアクセラレーションを実現しようとしています。

このように、SPIR-Vは最新のグラフィックスAPIで中心的な役割を果たすようになっており、ハードウェアに依存しないポータブルなシェーダープログラムを記述することができます。

開発フレームワーク

SPIR-Vを利用する開発フレームワークも登場しています。

Falcor: NVIDIA開発のリアルタイムレンダリングフレームワークで、DXILからSPIR-VへのトランスレータやSPIR-Vのプロファイリングツールが統合されています。
Bakkesmod: SPIR-VスクリプトをサポートするRocket Leagueのゲームプラグインです。マシンコードより高速にシェーダーを実行できます。
Filament: Google開発の物理ベースレンダリングエンジンで、メタルとVulkanのバックエンドにSPIR-Vをサポートしています。
Capstone: Embodied社がメタ空間のアプリ開発を目的とした、SPIR-Vに特化したフレームワークを開発中です。

このように、SPIR-Vは様々な開発フレームワークにおいてサポートが進んでいます。コンパイラや最適化ツール、デバッガなども整備が進められており、SPIR-V開発環境は年々充実しつつあります。

サンプルとユースケース

この章では、SPIR-Vの具体的な活用例としていくつかのサンプルを紹介します。また、産業分野におけるSPIR-Vの利用シーンについても説明します。

代表的なサンプル

ガウシアンブラー

このサンプルは、ガウシアンブラーフィルタをコンピュートシェーダーで実装したものです。画像のぼかし効果を並列処理で高速に実現できます。

#version 450
layout(local_size_x = 8, local_size_y = 8) in;

layout(set=0, binding=0) buffer InBuf {
    vec4 data[];
} inBuf;
    
layout(set=0, binding=1) buffer OutBuf {
    vec4 data[];
} outBuf;

layout(push_constant) uniform PushConsts {
    int radius;
} consts;

void main() {
    ivec2 pixelCoord = ivec2(gl_GlobalInvocationID.xy);
    vec4 blurResult = vec4(0.0);
    ...
    
    for (int r = -consts.radius; r <= consts.radius; ++r) {
        for (int c = -consts.radius; c <= consts.radius; ++c) {
            ivec2 offset = pixelCoord + ivec2(c, r);
            blurResult += inBuf.data[offset.y * imageSize.x + offset.x];
        }
    }
    
    blurResult /= (2.0 * consts.radius + 1.0) * (2.0 * consts.radius + 1.0);
    outBuf.data[pixelCoord.y * imageSize.x + pixelCoord.x] = blurResult;
}

レイマーチング

このサンプルは、レイマーチング手法を用いた体積レンダリングのフラグメントシェーダーです。三次元のスカラー場から等値面を抽出しています。

#version 460
#extension GL_EXT_ray_tracing : require

layout(set = 0, binding = 0) uniform accelerationStructureEXT accStructure;

layout(location = 0) rayPayloadEXT vec3 hitValue;

void main()
{
    // レイの初期化
    vec3 rayPos = vec3(gl_FragCoord.xy / vec2(1000.0), 0.0);
    vec3 rayDir = vec3(0.0, 0.0, -1.0); 
            
    // レイマーチングの実行
    float surfaceSqrDist = 1e20; // 初期値 
    for (int i = 0; i < 100; i++) {
        float distSqr = computeSDF(rayPos); // 署名付き距離関数の計算
        if (distSqr < surfaceSqrDist) {
            surfaceSqrDist = distSqr;
            hitValue = rayPos;  // hitValueにレイヒット位置を記録
        }
        rayPos += rayDir * sqrt(max(surfaceSqrDist, 0.001));
    }
    
    // 表面シェーディングの計算
    vec3 surfaceNormal = computeNormal(hitValue);
    vec3 lightDir = normalize(vec3(0.5, 0.3, 1.0));
    float diffuse = max(0.0, dot(surfaceNormal, -lightDir));
    outColor = vec4(diffuse * vec3(1.0, 0.8, 0.6), 1.0);
}

パーティクルシステム

このコンピュートシェーダーは、パーティクルの運動方程式を解いて、パーティクルの位置と速度を更新しています。

#version 460

layout(local_size_x = 64) in;

struct Particle {
    vec3 position;
    vec3 velocity;
};

layout(std430, binding = 0) buffer ParticlesA {
    Particle particlesA[];
} inParticles;

layout(std430, binding = 1) buffer ParticlesB {
    Particle particlesB[];
} outParticles;

uniform float deltaTime;

void main() {
    uint idx = gl_GlobalInvocationID.x;
    
    // 速度の更新
    outParticles.particlesB[idx].velocity = inParticles.particlesA[idx].velocity 
        + vec3(0.0, -9.8 * deltaTime, 0.0);
        
    // 位置の更新 
    outParticles.particlesB[idx].position = inParticles.particlesA[idx].position
        + inParticles.particlesA[idx].velocity * deltaTime;

    // 境界条件の処理
    if (outParticles.particlesB[idx].position.y < 0.0) {
        outParticles.particlesB[idx].velocity.y = -0.6 * outParticles.particlesB[idx].velocity.y;
        outParticles.particlesB[idx].position.y = 0.0;
    }
}

このようなサンプルを通じて、SPIR-Vでのシェーダーコーディングとデータ並列処理の具体例を学ぶことができます。

産業分野でのユースケース

SPIR-Vは、さまざまな分野でその活用が進んでいます。

ゲームエンジン: Unreal Engine、Unity、CryEngineなどの主要ゲームエンジンが次第にSPIR-Vをサポートしつつあります。ゲームのグラフィックスレンダリングやコンピュートシェーダーにSPIR-Vが利用されています。
CAD/CAM/CAE: コンピュータ支援設計や解析の分野でも、SPIR-VとGPGPUの組み合わせが注目されています。大規模シミュレーションや形状処理を高速に実行できます。
機械学習/AI: ディープラーニングなどの機械学習タスクにおいて、SPIR-VとGPUの並列処理能力を活用するケースが増えています。コンピュートシェーダーによるニューラルネットワーク演算の高速化が図られています。
科学技術計算: 物理シミュレーションや数値解析、可視化などの科学技術計算の分野でも、SPIR-VとGPGPUの活用が進んでいます。大規模データの並列処理に適しています。
メディア処理: 動画や画像などのメディアデータ処理では、SPIR-VとGPUによるエンコード/デコード、フィルタリング、合成処理などが行われています。
クラウド/エッジコンピューティング: クラウドサーバやエッジデバイスにおいて、SPIR-VによるGPUアクセラレーションが注目されています。データセンターGPUやIoTデバイスでの活用が期待されています。
医用画像処理: CT、MRI、PETなどの3次元医用画像データに対して、SPIR-Vベースのコンピュートシェーダーによる高速処理が適用されています。ノイズ除去、領域抽出、可視化などの処理が行われます。
放射線治療計画: 放射線治療の線量分布計算では、SPIR-VとGPUの並列処理能力を活用したアプリケーションが開発されています。治療計画の高速化とシミュレーション精度の向上が図られています。
臓器モデリング: 患者個人の臓器形状をモデリングするために、SPIR-Vベースのジオメトリ処理が利用されているケースもあります。手術シミュレーションなどに役立ちます。
バイオインフォマティクス: 遺伝子やタンパク質などのバイオインフォマティクスデータの並列処理にも、SPIR-VとGPUが活用されつつあります。大規模データ解析の高速化が期待されています。

このように、GPUの並列処理能力を生かしたSPIR-Vベースのアプリケーションが、様々な分野のワークロードを高速化する動きが出てきています。今後ますますその重要性が高まっていくでしょう。