dskjal
deeplearning カテゴリの記事一覧を表示しています。
広告
広告

Waifu Diffusion で効率的に画像を生成する

カテゴリ:deeplearning

プロンプトリストはプロンプトよく検索されているプロンプト(R18)danbooru タグ検索を参照。

目次

続きを読む

AI を使用した漫画作画

カテゴリ:deeplearning

この記事の作例は指定がなければ Qwen Image Edit 2511 を使っている。

目次

続きを読む

ComfyUI の ConditioningZeroOut ノードの使い方

カテゴリ:deeplearning

続きを読む

蒸留技術まとめ

カテゴリ:deeplearning

続きを読む

Qwen Image Layered を ComfyUI で動かす

カテゴリ:deeplearning

Qwen/Qwen-Image-Layered

Qwen Image Layered は画像1枚とプロンプトを入力すると、複数枚の透過画像を出力するモデルだ。

学習画像は主にポスターで、文字・画像・背景・小物を分離するのが得意だ。Live2D 用に人体のパーツを分解することはできない。

続きを読む

Wan 2.1 の論文メモ

カテゴリ:deeplearning

続きを読む

Diffusion-DPO(Diffusion-Direct Preference Optimization)の学習方法

カテゴリ:deeplearning

Diffusion-DPO Diffusion Model Alignment Using Direct Preference Optimization は SD3 でも使われた強化学習手法。SD3 ではランク 128 の LoRA として作成している。

ただし、画風や新しい概念の学習のような一般的なタスクは SFT(教師ありファインチューニング)が適している。「○○がうまく描けない」というニーズは○○が言語化できているので SFT を使うべき。SFT はデータセットを用意しやすいし学習負荷も低い。

Diffusion-DPO を使うケース

  • 言語化が困難だが描いてほしくないもの(暴力的・性的表現)がある
  • ユーザーの選好データを持っている
  • 細部の表現の崩れを改善したい

SFT(教師ありファインチューニング)と Diffusion-DPO との違い

続きを読む

bong_tangent スケジューラーの特徴

カテゴリ:deeplearning

続きを読む