ComfyUI のスタックトレースを取得する
カテゴリ:deeplearning
蒸留技術まとめ
カテゴリ:deeplearning
ComfyUI の EmptyLatentImage と EmptySD3LatentImage の違い
カテゴリ:deeplearning
スケール則の終わり
カテゴリ:deeplearning
LLM のスケール則はモデルサイズ、データセットサイズ、学習に使う計算量の3つを適切な比率で増加させれば、LLM の性能は増加量に比例して向上する、という経験則だ。
しかし LLM のデータセットは Web のスクレイピングデータで、それで差別化するのが困難になった。その結果 CoT や RLVR のような計算リソースをつぎ込んで性能を上げる手法を使うようになった。現在の方向では最も低コストな計算リソースを所有する企業が勝者になり、それは自社で学習・推論用 TPU を設計・製造できる Google になる可能性が高い。
Qwen Image Layered を ComfyUI で動かす
カテゴリ:deeplearning
Qwen Image Layered は画像1枚とプロンプトを入力すると、複数枚の透過画像を出力するモデルだ。
学習画像は主にポスターで、文字・画像・背景・小物を分離するのが得意だ。Live2D 用に人体のパーツを分解することはできない。
タグキャプションを使用した大規模学習
カテゴリ:deeplearning
python, torch, cuda の tips
カテゴリ:deeplearning
CUDA は後方互換性があるので、nvcc -V の出力より前のライブラリでビルドされているものも実行できる。
Python 3.13 で kohya-ss sd-scripts の環境構築
カテゴリ:deeplearning
xformers は使わない(--sdpa を使う)ので入れていない。
よく検索されているプロンプト(R18)
カテゴリ:deeplearning
Z Image の LoRA 作成 tips
カテゴリ:deeplearning