Danbooru タグ検索

カテゴリ：deeplearning

Blender でハードサーフェスモデリング

カテゴリ：blender

一般的なポリゴンモデリングに役立つツールはモデリングの際に知っておくと便利な機能を参照。

よく検索されているプロンプト（R18）

カテゴリ：deeplearning

EEVEE のセルルック技法まとめ

カテゴリ：blender

Stable Diffusion のファインチューンの Tips

カテゴリ：deeplearning

LoRA はLoRA の学習方法へ移動した。

LoRA 以外の情報（Hypernetwork や Textual Inversion、Dreambooth）はStable Diffusion の古い情報へ移動した。

U-Net の学習

わかりやすい解説として「U-Net は画像のデノイズを行う」という説明がされるが、これは正確には間違いだ。U-Net は除去すべきノイズを出力する。

学習のプロセスは以下のようになる。

ランダムにタイムステップ t ∈ [0, 1000]を選ぶ
教師画像にタイムステップ t に対応するノイズを付与する
U-Net にノイズを付与した教師画像とタイムステップ t とコンテクスト（embedding 化したキャプション）を入力
U-Net が除去すべきノイズを出力する
付与したノイズと U-Net が出力したノイズとの差分から平均二乗誤差（MSE）を計算する
差分を逆伝播して学習する

タイムステップはノイズの量をきめる。0 が教師画像そのもので、1000 が純粋なノイズ画像だ。

概要

2023 年８月現在 LoRA 一強の状況で、Textual Inversion・Hypernetwork・Dreambooth（正則化画像）はほとんど使われていない。

LoRA の学習方法

カテゴリ：deeplearning

画像加工

データの水増し

過学習防止

正則化画像は必要か

prior_loss_weight

学習

高速化

シードの固定

画風の学習

外部リンク

U-Net や Diffusion Transformer はどのようにして可変解像度に対応しているのか

カテゴリ：deeplearning

カテゴリ

T2I 拡散モデルの設計メモ

Waifu Diffusion で効率的に画像を生成する

目次

Blender の輪郭抽出技法まとめ

目次

Danbooru タグ検索

Blender でハードサーフェスモデリング

目次

よく検索されているプロンプト（R18）

EEVEE のセルルック技法まとめ

目次

Stable Diffusion のファインチューンの Tips

目次

U-Net の学習

概要

LoRA の学習方法

U-Net や Diffusion Transformer はどのようにして可変解像度に対応しているのか