T2I 拡散モデルの設計メモ
カテゴリ:deeplearning
Waifu Diffusion で効率的に画像を生成する
カテゴリ:deeplearning
プロンプトリストはプロンプトやよく検索されているプロンプト(R18)、danbooru タグ検索を参照。
目次
- ワークフロー
- ツールの選択
- Stable Diffusion のモデルリンク
- Stable Diffusion の解説
- Tips
- 上手く描けない場合(胴が長いなど)はアスペクト比を変えてみる
- クオリティタグを使う
- CFG Scale を上げる
- 解像度を上げると頭や体が複数融合する
- Denoising Strength を下げると画質が落ちる
- 細部の修正
- 手の修正
- 手の自由度
- 高解像度化
- 色のコントロール
- 顔に影ができる
- ファインチューニング
Blender の輪郭抽出技法まとめ
カテゴリ:blender
目次
- 概要
- 直接テクスチャや頂点に描く方法
- マテリアルのフレネルノードを使う方法
- ラインアート(2.93)
- 画像をグリースペンシルオブジェクトへ変換(2.91)
- 背面法(Inverted Hull)
- ソリッド化モディフィア
- ジオメトリノード
- ディスプレイスモディフィア
- ベベルモディフィア
- 辺分離モディフィア
- ジオメトリノード(3.1)
- フリースタイル
- コンポジター
- アドオン
- 一般的な構成
- ビューポートコンポジター(3.5)
- アンチエイリアス
- フィルターノードで線画抽出
- 法線/深度を使う
- ワールド位置を使う
- Cycles・Eevee でクリース・交差線検出
- 明度差/色を使う
- Object/Material ID を使う
- 覆い焼き(Dodge)を使う
- 頂点色を使ってソーベルの輪郭抽出をコントロールする
- 輪郭の太さを変更する
- 余計な線を消す方法
- オブジェクトの交差する部分に線を出す
- UV
- Cycles・Eevee
Danbooru タグ検索
カテゴリ:deeplearning
Blender でハードサーフェスモデリング
カテゴリ:blender
一般的なポリゴンモデリングに役立つツールはモデリングの際に知っておくと便利な機能を参照。
目次
- 概要
- 正面図からモデリングする方法
- ベベル
- ベベルモディフィアとブールモディフィア
- ベベルと辺の関係
- Korean Bevel
- 法線のハード化(2.80)
- ベベルシェーダを使う
- カスタムプロファイル(2.82)
- ジオメトリノードで法線ブレンド(4.5)
- ベベルを修正する5つの方法
- ブール
- シャープなエッジを作る
- 再分割曲面モディフィアでシャープなエッジを作る
- エッジ検出
- スキンワープテクニックを使う
- 非破壊編集
- エディットモードで使うテクニック
- 便利なツール
- よく使うパターン
- 溝を掘る
- n ゴンの使い方
- 穴を開ける10の方法
- パイプ・ケーブル
- アドオン
- そのほか
よく検索されているプロンプト(R18)
カテゴリ:deeplearning
EEVEE のセルルック技法まとめ
カテゴリ:blender
目次
- コンポジターシェーディング(4.5)
- バージョン 4.2 以降
- 重要な変更点
- シャドウにジャギーがでる(4.5)
- バンド状の影や細かいノイズがでる
- ソフトシャドウを消す
- 落ち影にノイズがのる
- 落ち影にジャギーがでる
- 半透明の部分にノイズが乗る
- 影を落とさない
- 放射の間接照明を切る
- ブルームがない
- 描画順操作
- ブレンドマテリアルの使いどころ
- コンポジター問題
- カラーマネジメント
- 法線のコンポジット出力
- 陰影なし表示
- ライト
- 基本
- 2影
- テクスチャを使う
- テクスチャで影を制御する
- リムライト
- 透過
- 描画順のコントロール
- 反射
- 頂点色の取得
- 任意の場所に影を作る
- 輪郭抽出
- 背景の影響力を消す
Stable Diffusion のファインチューンの Tips
カテゴリ:deeplearning
LoRA はLoRA の学習方法へ移動した。
LoRA 以外の情報(Hypernetwork や Textual Inversion、Dreambooth)はStable Diffusion の古い情報へ移動した。
目次
U-Net の学習
わかりやすい解説として「U-Net は画像のデノイズを行う」という説明がされるが、これは正確には間違いだ。U-Net は除去すべきノイズを出力する。
学習のプロセスは以下のようになる。
- ランダムにタイムステップ t ∈ [0, 1000]を選ぶ
- 教師画像にタイムステップ t に対応するノイズを付与する
- U-Net にノイズを付与した教師画像とタイムステップ t とコンテクスト(embedding 化したキャプション)を入力
- U-Net が除去すべきノイズを出力する
- 付与したノイズと U-Net が出力したノイズとの差分から平均二乗誤差(MSE)を計算する
- 差分を逆伝播して学習する
タイムステップはノイズの量をきめる。0 が教師画像そのもので、1000 が純粋なノイズ画像だ。
概要
2023 年8月現在 LoRA 一強の状況で、Textual Inversion・Hypernetwork・Dreambooth(正則化画像) はほとんど使われていない。
LoRA の学習方法
カテゴリ:deeplearning
- 画像加工
- トリミング
- 背景除去
- 白背景
- 物体検出
- Aspect Ratio Bucketing
- キャプション・設定ファイル
- キャプション方式
- タグ編集アプリ
- キャプションファイルの先頭にタグを追記するコマンド
- 設定ファイルの class_tokens
- トリガーワード
- 画風学習のキャプションファイル
- キャラ学習のキャプションファイル
- keep_tokens
- VRAM 削減
- mixed_precision
- xformers
- gradient_checkpointing gradient_accumulation_steps
- データの水増し
- 過学習防止
- 学習
- fp16 と bf16
- サンプルの出力
- 学習方式の選択
- リピート数とエポック数
- network_dim
- dim_from_weights network_weights
- network_alpha base_weights base_weights_multiplier
- min_snr_gamma
- debiased_estimation
- zero_terminal_snr
- v_parameterization
- noise_offset
- 学習率
- スケジューラ
- オプティマイザ
- 階層別学習率
- 高速化
- 省メモリ設定
- logging_dir
- SDXL
- 検証
- 学習の再開
- メタデータの閲覧
U-Net や Diffusion Transformer はどのようにして可変解像度に対応しているのか
カテゴリ:deeplearning