Apple の The Illusion of Thinking の誤解
X(旧 Twitter)では Apple の The Illusion of Thinking: Understanding the Strengths and Limitations of Reasoning Models via the Lens of Problem Complexity という論文が「LRM は推論をしてるのではなくパターンマッチングをしているだけ」と主張しているという、間違いを信じている人が多い。
しかし、この論文はそのような主張はしていない。
実際の論文の内容
Waifu Diffusion で効率的に画像を生成する
プロンプトリストはプロンプトやよく検索されているプロンプト(R18)、danbooru タグ検索を参照。
目次
- ワークフロー
- ツールの選択
- Stable Diffusion のモデルリンク
- Stable Diffusion の解説
- Tips
- 上手く描けない場合(胴が長いなど)はアスペクト比を変えてみる
- クオリティタグを使う
- CFG Scale を上げる
- 解像度を上げると頭や体が複数融合する
- Denoising Strength を下げると画質が落ちる
- 細部の修正
- 手の修正
- 手の自由度
- 高解像度化
- 色のコントロール
- 顔に影ができる
- ファインチューニング
Danbooru タグ検索
LLM を使ったストーリー作成
LLM を使ったストーリー作成が一発でうまくいく事はない。なので、ストーリー作成の各工程ごとにアイデア出しの補助をさせることでストーリーを作成する。
AI のべりすとは日本語が使えるが性能は高くない。無料で公開されているローカル実行できる LLM を英語で使ったり、Chat GPT を使う方が効率がいい。AI のべりすとの強みはアダルト文章を日本語で出力できることだ。
目次
よく検索されているプロンプト(R18)
EEVEE の使い方(バージョン 4.2 以降)
EEVEE は Cycles と同じ物理ベースのレンダラーだ。ただしパストレーシングの Cycles と違って、EEVEE はゲームエンジンで使われるラスタライズ法でレンダリングされる。パストレーシング(Cycles)では自動的に処理されるような表現の一部は、ラスタライズ法(EEVEE)ではユーザーが明示的にセットアップする必要がある。
バージョン 4.2 以降の EEVEE はラスタライズ法でレンダリングされ、一部のエフェクト(影・反射・屈折・大域照明など)をスクリーンスペースレイトレーシングで行う。Cycles のようにシーン内でレイを飛ばす3Dのレイトレーシングではないことに注意が必要だ。なので反射や屈折は不正確で、画面外の情報はライトプローブにベイクしなければ取得できない。
この記事ではバージョン 4.2 以降を対象としている。古いバージョンはEevee の使い方を参照。
目次
- シェーダのコンパイルが遅い
- バンド状の影や細かいノイズがでる
- ライトノードが機能しない
- EEVEE Next
- 移行ガイド
- サポートするGPU
- パスのプレビュー
- フィルム
- オブジェクトモーションブラー
- 異方性
- ジッターシャドウ
- 影の解像度
- EEVEE のレンダー方法
- 鏡面反射
- 透過・屈折
- 反射・屈折の品質を上げる
- 反射と屈折とのトレードオフ
- 間接照明・放射
- ボリューメトリック
- セルシェーディング
- 被写界深度
- Reverse Z
- レイトレースの設定
NoobAI-XL 1.0 のアーティストブレンド例
固定幅入力・逆順生成の動画生成 AI FramePack の論文の解説
LoRA の学習方法
- 画像加工
- トリミング
- 背景除去
- 白背景
- 物体検出
- Aspect Ratio Bucketing
- キャプション・設定ファイル
- キャプション方式
- タグ編集アプリ
- キャプションファイルの先頭にタグを追記するコマンド
- 設定ファイルの class_tokens
- トリガーワード
- 画風学習のキャプションファイル
- キャラ学習のキャプションファイル
- keep_tokens
- VRAM 削減
- mixed_precision
- xformers
- gradient_checkpointing gradient_accumulation_steps
- データの水増し
- 過学習防止
- 学習
- fp16 と bf16
- サンプルの出力
- 学習方式の選択
- リピート数とエポック数
- network_dim
- dim_from_weights network_weights
- network_alpha base_weights base_weights_multiplier
- min_snr_gamma
- debiased_estimation
- zero_terminal_snr
- v_parameterization
- noise_offset
- 学習率
- スケジューラ
- オプティマイザ
- 階層別学習率
- 高速化
- 省メモリ設定
- logging_dir
- SDXL
- 検証
- 学習の再開
- メタデータの閲覧
AUTOMATIC1111 の Dreambooth の使い方
LoRA はLoRA の学習方法に移動した。