dskjal
広告
広告

SDXL Q8_0 量子化が流行らない理由

カテゴリ:deeplearning

VRAM を 800 MB 節約できるだけで、生成速度は fp16 と変わらないから。

環境

結果

モデル生成時間(sec)VRAM 使用量(GB)
fp16246.7
Q8_0245.9

量子化方法

Stable Diffusionのモデルを量子化して画像生成する

SD 1.5、SDXL、SD 3、FLUX.1、AuraFlowモデルのGGUF化と利用方法(Windows)


広告
広告

カテゴリ