dskjal
deeplearning カテゴリの記事一覧を表示しています。
広告
広告

ComfyUI の ModelSamplingAuraFlow とは何か

カテゴリ:deeplearning

ModelSamplingAuraFlow は高解像度画像を生成する際に、ノイズが不足しないようにするノード。

中身は ModelSamplingSD3 ノードと同じ。詳細は SD3 論文の p. 10 Resolution-dependent shifting of timestep schedules を参照。

ModelSamplingAuraFlow の shift を増やすと実質的にノイズの量が増える。それによって以下の効果が得られる:

  1. 画像のディティールが増える
  2. 構図や全体の色の確定に時間(ステップ数)がかかるので、全体の構図や色のエラーが起こりづらくなる

続きを読む

VRAM8GB で Z Image の LoRA作成

カテゴリ:deeplearning

目次



続きを読む

LLM を使ったストーリー作成

カテゴリ:deeplearning

LLM を使ったストーリー作成が一発でうまくいく事はない。なので、ストーリー作成の各工程ごとにアイデア出しの補助をさせることでストーリーを作成する。

AI のべりすとは日本語が使えるが性能は高くない。無料で公開されているローカル実行できる LLM を英語で使ったり、Chat GPT を使う方が効率がいい。AI のべりすとの強みはアダルト文章を日本語で出力できることだ。

モデルについてはおすすめの日本語対応ローカル大規模言語モデルを参照。

目次

続きを読む

ComfyUI の CFGNorm・Adaptive Projected Guidance・CFG Zero Star ノードとは何か

カテゴリ:deeplearning

CFG 系のアルゴリズムのまとめはCFG Zero Starとかを参照。

続きを読む

python, torch, cuda の tips

カテゴリ:deeplearning

CUDA は後方互換性があるので、nvcc -V の出力より前のライブラリでビルドされているものも実行できる。

続きを読む

AUTOMATIC1111 の便利な機能

カテゴリ:deeplearning

AUTOMATIC1111 は更新を停止している。以下の移行先がある。

  • ComfyUI:最もユーザーが多く最新技術がいち早く取り入れられる。AUTOMATIC1111 と互換性はない
  • sd-webui-forge-classic:SD 1.5・SDXL 専用。AUTOMATIC1111 と互換性あり
  • sd-webui-forge-neo:classic と同じ作成者で最新機能を取り入れるブランチ。すでに Qwen Image Edit・Lumina Image 2.0・Wan・SageAttention などの技術は実装済み。AUTOMATIC1111 と互換性あり
  • vladmandic/sdnext:A1111 と互換性はないが、最新モデルの対応が早く、AMD の ROCm に対応

目次

続きを読む

ComfyUI で NetaYume-Lumina-Image-2.0

カテゴリ:deeplearning

次世代の NSFW モデルは Anima が軽量で NSFW が出せて自然言語に対応しており最有力候補。

目次

続きを読む

Qwen Image Edit 2511 を ComfyUI で実行する+プロンプトリスト

カテゴリ:deeplearning

目次

続きを読む

Windows で Radeon を使って ComfyUI や Automatic1111WebUI を動かす

カテゴリ:deeplearning

続きを読む

Waifu Diffusion で効率的に画像を生成する

カテゴリ:deeplearning

プロンプトリストはプロンプトよく検索されているプロンプト(R18)danbooru タグ検索を参照。

目次

続きを読む


広告
広告