広告

広告

VRAM 8 GB で Qwen Image（Edit）を ComfyUI で実行する

カテゴリ：deeplearning

目次

続きを読む

T2I 拡散モデルの設計メモ

カテゴリ：deeplearning

目次

学習方法

性能検証

高速化

SFT vs RL

続きを読む

NoobAI のテキストエンコーダーは壊れている

カテゴリ：deeplearning

続きを読む

よく検索されているプロンプト（R18）

カテゴリ：deeplearning

続きを読む

Waifu Diffusion で効率的に画像を生成する

カテゴリ：deeplearning

プロンプトリストはプロンプトやよく検索されているプロンプト（R18）、danbooru タグ検索を参照。

目次

ワークフロー

Stable Diffusion の解説

Tips

ファインチューニング

プロンプト

AI が描いた絵の見分け方

解説リンク

続きを読む

VRAM 8 GB・ComfyUI で NetaYume-Lumina-Image-2.0

カテゴリ：deeplearning

続きを読む

Apple の The Illusion of Thinking の誤解

カテゴリ：deeplearning

X（旧 Twitter）では Apple の The Illusion of Thinking: Understanding the Strengths and Limitations of Reasoning Models via the Lens of Problem Complexity という論文が「LRM は推論をしてるのではなくパターンマッチングをしているだけ」と主張しているという、間違いを信じている人が多い。

しかし、この論文はそのような主張はしていない。

実際の論文の内容

続きを読む

torch と cuda の tips

カテゴリ：deeplearning

CUDA は後方互換性があるので、nvcc -V の出力より前のライブラリでビルドされているものも実行できる。

続きを読む

Pytorch モデルを fp16 で動作させる方法

カテゴリ：deeplearning

pytorch のモデルは half() を呼び出せば fp16 になる。しかし、LayerNormalization などのレイヤーは非常に小さな値を扱うので、fp32 で動作させた方が良い。

続きを読む

Python 3.11.6 で reforge を使う

カテゴリ：deeplearning

ROCm の whl のサポートが 3.11 からなので、3.11 で動作することは重要だ。

続きを読む

広告

広告

カテゴリ