Wan2.2 の timestep 境界 0.875 の計算
0.875 にはならないが以下の方法で計算していると考えられる。
Waifu Diffusion で効率的に画像を生成する
プロンプトリストはプロンプトやよく検索されているプロンプト(R18)、danbooru タグ検索を参照。
目次
- ワークフロー
- ツールの選択
- Stable Diffusion のモデルリンク
- Stable Diffusion の解説
- Tips
- 上手く描けない場合(胴が長いなど)はアスペクト比を変えてみる
- クオリティタグを使う
- CFG Scale を上げる
- 解像度を上げると頭や体が複数融合する
- Denoising Strength を下げると画質が落ちる
- 細部の修正
- 手の修正
- 手の自由度
- 高解像度化
- 色のコントロール
- 顔に影ができる
- ファインチューニング
よく検索されているプロンプト(R18)
T2I 拡散モデルの設計メモ
目次
- クラウド GPU
- テキストエンコーダー
- VAE
- GAN
- コンディショニング
- 位置埋め込み
- 目的関数
- Transformer アーキテクチャ
- Transformer を使わないアーキテクチャ
- Gated MLP
- ブロック図
- データセット
- キャプショニング
- 学習方法
- 高速化
- ワーキングメモリー
- 教師ありファインチューニング
- 強化学習
NAG Normalized Attention Guide の原理
クリエイター関係の法律に関するよくある誤解
目次
- 「請負契約は口頭でも成立する」は証拠が不要という意味ではない
- 著作権は譲渡できる
- 著作者人格権は制限できる
- 「著作権侵害は親告罪なので起訴されてないならば合法」は間違い
- 「白黒を判定する権利があるのは著作権者」は間違い
- 「著作権法はアイデアを保護しない」は間違い
- 「ゾーニングされているSNSだから公衆にはあたらない」は間違い
- 企業内複製・業務上の複製(漫画家が資料として画像をダウンロード)も複製権侵害になる
- 教育のための複製でも著作権者への補償金が必要
- 写真のトレースが著作権侵害になる可能性はある
- イラストのトレース検証で名誉棄損が認定された判例がある
- 「無許諾で二次的著作物を作成したが、私的利用が目的のため著作権侵害にはならない」は間違い
- 「他人のイラストを参考にしてイラストを作成したが、ポーズや構図を変えているから著作権侵害にはあたらない」は間違い
- 「無許諾で二次的著作物を作成したが、特定少数にだけ公開しているので著作権侵害にはあたらない」は間違い
- 日本ではパロディは著作権侵害になる可能性が高い
- 「非営利なら無許諾で二次創作を公開・頒布しても合法」は間違い
- キャラクターに著作権は発生しない
- AI による画像生成
- 「AI が生成した画像に著作権は発生しない」は間違い
- 「プロンプトには著作権がない」は間違い
- 「生成AIの出力は依拠の立証ができないので合法」は間違い
- 新橋玉木屋事件(煮豆売り事件)
- 生成AIの利用者も著作権侵害になる
- 生成 AI を用いたサービス提供を行う事業者が著作権侵害になるケース
- 無版権二次創作同人誌の無断転載事件
- 不正競争防止法による模倣の判例
- 写真素材に依拠して作成されたが著作権侵害が否定された判例がある
- 自炊代行は複製権の侵害になる
- コンビニコピー機(ネットプリント含む)で他人の著作物を複製すると複製権の侵害になる
- 外部リンク
「請負契約は口頭でも成立する」は証拠が不要という意味ではない
請負は諾成契約であり契約書の作成は不要である(民法第632条)。請負契約は口頭でも成立するが、裁判でそれを主張するには口頭で契約した証拠(録音・第三者の証言・メールのやりとり等)が必要になる。契約の立証責任は「契約が存在する」と主張する側にあるため、契約書を作るのが確実だ。
著作権は譲渡できる
譲渡できないのは著作者人格権だ(59条)。著作権の譲渡は61条に定められている。
著作者人格権は制限できる
中山信弘著『著作権法』(有斐閣,2007年)p. 364 では以下のように解説している。
著作者人格権には一般的人格権に相当するものも包含されており、著作者人格権の全てを、財産権と同様な意味で放棄可能とする解釈は採りえないであろう。他方実務においては、必要に迫られて、著作者人格権の不行使特約を締結する例も多いが、未だ司法の確定的な判断はなく、疑心暗鬼の中で実務は進んでいる状況と言えよう。今後は、放棄の態様に応じた検討が必要である。
公表権を制限する契約は一般的だ。たとえば、未発表のゲームのテキストの翻訳を下請けに出すとする。下請けが、その翻訳をゲーム発表前に公表すると問題になる。つまりリークを防ぐために、公表権を制限する必要がある。
同一性保持権を制限する契約も多い。イラストの色調を補正したりトリミングしたりして、イラストを使用することがよくあるからだ。
外部リンク
改変への包括的な黙示の同意と同一性保持権―食品包装デザイン事件― 東京地裁判平成29. 11. 30平成28年(ワ)23604号[食品包装デザイン]
「著作権侵害は親告罪なので起訴されてないならば合法」は間違い
ComfyUI の ModelSamplingAuraFlow とは何か
ModelSamplingAuraFlow は高解像度画像を生成する際に、ノイズが不足しないようにするノード。
中身は ModelSamplingSD3 ノードと同じ。詳細は SD3 論文の p. 10 Resolution-dependent shifting of timestep schedules を参照。
ノイズを増量することで画像にディティールを追加する使い方もできる。
VRAM 8 GB で Qwen Image(Edit)を ComfyUI で実行する
目次
Wan 2.1 の論文メモ
スケール則の終わり
LLM のスケール則はモデルサイズ、データセットサイズ、学習に使う計算量の3つを適切な比率で増加させれば、LLM の性能は増加量に比例して向上する、という経験則だ。
そしてこのスケール則は以下の要因で終わりに近づいている。