dskjal
deeplearning カテゴリの記事一覧を表示しています。
広告
広告

Waifu Diffusion で効率的に画像を生成する

カテゴリ:deeplearning

プロンプトリストはプロンプトよく検索されているプロンプト(R18)danbooru タグ検索を参照。

目次

続きを読む

Textual Inversion の使い方

カテゴリ:deeplearning

目次

続きを読む

LLM を使ったストーリー作成

カテゴリ:deeplearning

LLM を使ったストーリー作成が一発でうまくいく事はない。なので、ストーリー作成の各工程ごとにアイデア出しの補助をさせることでストーリーを作成する。

AI のべりすとは日本語が使えるが性能は高くない。無料で公開されているローカル実行できる LLM を英語で使ったり、Chat GPT を使う方が効率がいい。AI のべりすとの強みはアダルト文章を日本語で出力できることだ。

目次

続きを読む

よく検索されているプロンプト(R18)

カテゴリ:deeplearning

続きを読む

Danbooru タグ検索

カテゴリ:deeplearning

続きを読む

LoRA の学習方法

カテゴリ:deeplearning

続きを読む

NovelAI Diffusion V3 の改善点

カテゴリ:deeplearning

続きを読む

AUTOMATIC1111 の便利な機能

カテゴリ:deeplearning

目次

  • 操作
    • Generate ボタンを右クリック > Generate forever で止めるまで生成。止めるときは右クリック > cancel
    • Ctrl + Enter で Generate
    • Ctrl + Z プロンプトを元に戻す
    • スライダーをクリックした後十字キーで1ずつ増減できる
    • Alt + ← or → カンマ区切りの文字を選択して左右移動(1.5.0 以降)

続きを読む

Stable Diffusion のファインチューンの Tips

カテゴリ:deeplearning

LoRA はLoRA の学習方法へ移動した。

LoRA 以外の情報(Hypernetwork や Textual Inversion、Dreambooth)はStable Diffusion の古い情報へ移動した。

目次

U-Net の学習

わかりやすい解説として「U-Net は画像のデノイズを行う」という説明がされるが、これは正確には間違いだ。U-Net は除去すべきノイズを出力する

学習のプロセスは以下のようになる。

  1. ランダムにタイムステップ t ∈ [0, 1000]を選ぶ
  2. 教師画像にタイムステップ t に対応するノイズを付与する
  3. U-Net にノイズを付与した教師画像とタイムステップ t とコンテクスト(embedding 化したキャプション)を入力
  4. U-Net が除去すべきノイズを出力する
  5. 付与したノイズと U-Net が出力したノイズとの差分から平均二乗誤差(MSE)を計算する
  6. 差分を逆伝播して学習する

タイムステップはノイズの量をきめる。0 が教師画像そのもので、1000 が純粋なノイズ画像だ。

概要

2023 年8月現在 LoRA 一強の状況で、Textual Inversion・Hypernetwork・Dreambooth はほとんど使われていない。ただし LoRA のファインチューン方式としての Dreambooth は現在も使用されている。

続きを読む