deeplearning カテゴリの記事一覧を表示しています。

広告

広告

よく検索されているプロンプト（R18）

カテゴリ：deeplearning

続きを読む

Wan2.2 の timestep 境界 0.875 の計算

カテゴリ：deeplearning

0.875 にはならないが以下の方法で計算していると考えられる。

続きを読む

Tsukasa-Speech を Windows で GPU で動かす

カテゴリ：deeplearning

デフォルトの状態ではメモリが解放されず、動作を続けると VRAM が不足するのでアプリの再起動が必要になる。

512 トークン制限があり、一度に生成できる文字数は日本語の場合 200 文字に届かない程度。

ファイルアップロードバグ

gr.Audio にはバグがあり、"Too little data for declared Content-Length" のエラーメッセージで、リファレンス音声の再アップロードに失敗する。詳細は Audio component: gradio RuntimeError: Response content shorter than Content-Length #8878 を参照。大きいファイルではエラーが起こらず、小さいファイルを再アップロードすると発生することから、キャッシュが悪さをしている可能性がある。

対処法としては

アプリを再起動
ファイルをリネームしてアップロード

続きを読む

NAG Normalized Attention Guide の原理

カテゴリ：deeplearning

続きを読む

ComfyUI の CFGNorm・Adaptive Projected Guidanceノードとは何か

カテゴリ：deeplearning

続きを読む

LLM を使ったストーリー作成

カテゴリ：deeplearning

LLM を使ったストーリー作成が一発でうまくいく事はない。なので、ストーリー作成の各工程ごとにアイデア出しの補助をさせることでストーリーを作成する。

AI のべりすとは日本語が使えるが性能は高くない。無料で公開されているローカル実行できる LLM を英語で使ったり、Chat GPT を使う方が効率がいい。AI のべりすとの強みはアダルト文章を日本語で出力できることだ。

モデルについてはおすすめの日本語対応ローカル大規模言語モデルを参照。

目次

続きを読む

Python 3.11.6 で reforge を使う

カテゴリ：deeplearning

ROCm の whl のサポートが 3.11 からなので、3.11 で動作することは重要だ。

forge-classic は python 3.11、torch 2.8.0、cuda 12.8 なのでこちらを使った方が早い。

続きを読む

Wan 2.1 の論文メモ

カテゴリ：deeplearning

続きを読む

Windows で llama.cpp のビルド

カテゴリ：deeplearning

続きを読む

oobabooga の tips

カテゴリ：deeplearning

AIのべりすとのようにプロンプトを編集しながらテキストを生成する

Default タブでできる。

テキスト生成のショートカットは Shift + Enter。

CPU のスレッド数を制限する

CPU で処理する場合４スレッドあたりで性能の限界が来る。E コアや Hyperthreading がスレッドをつかむと遅くなるので、Model タブで実行スレッドを制限する。

一部の処理を GPU にオフロードする

続きを読む

広告

広告

カテゴリ