dskjal
広告
広告

Python 3.13 で kohya-ss sd-scripts の環境構築

カテゴリ:deeplearning

xformers は使わない(--sdpa を使う)ので入れていない。

続きを読む

VRAM 8 GB で Qwen Image(Edit)を ComfyUI で実行する

カテゴリ:deeplearning

目次

続きを読む

LoRA の学習方法

カテゴリ:deeplearning

続きを読む

蒸留技術まとめ

カテゴリ:deeplearning

続きを読む

Tsukasa-Speech を Windows で GPU で動かす

カテゴリ:deeplearning

Tsukasa-Speech

デフォルトの状態ではメモリが解放されず、動作を続けると VRAM が不足するのでアプリの再起動が必要になる。

512 トークン制限があり、一度に生成できる文字数は日本語の場合 200 文字に届かない程度。

ファイルアップロードバグ

gr.Audio にはバグがあり、"Too little data for declared Content-Length" のエラーメッセージで、リファレンス音声の再アップロードに失敗する。詳細は Audio component: gradio RuntimeError: Response content shorter than Content-Length #8878 を参照。大きいファイルではエラーが起こらず、小さいファイルを再アップロードすると発生することから、キャッシュが悪さをしている可能性がある。

対処法としては

  • アプリを再起動
  • ファイルをリネームしてアップロード

続きを読む

torch と cuda の tips

カテゴリ:deeplearning

CUDA は後方互換性があるので、nvcc -V の出力より前のライブラリでビルドされているものも実行できる。

続きを読む

T2I 拡散モデルの設計メモ

カテゴリ:deeplearning

目次

続きを読む

Windows で Radeon を使って ComfyUI や Automatic1111WebUI を動かす

カテゴリ:deeplearning

続きを読む

Apple の The Illusion of Thinking の誤解

カテゴリ:deeplearning

X(旧 Twitter)では Apple の The Illusion of Thinking: Understanding the Strengths and Limitations of Reasoning Models via the Lens of Problem Complexity という論文が「LRM は推論をしてるのではなくパターンマッチングをしているだけ」と主張しているという、間違いを信じている人が多い。

しかし、この論文はそのような主張はしていない。

実際の論文の内容

続きを読む

Waifu Diffusion で効率的に画像を生成する

カテゴリ:deeplearning

プロンプトリストはプロンプトよく検索されているプロンプト(R18)danbooru タグ検索を参照。

目次

続きを読む


広告
広告