コンパイラはこれまでにプログラミングを1000倍加速してない
リーナス・トーバルズは東京開催のOpen Source Summit Japan基調講演で「コンパイラはこれまでにプログラミングを1000倍加速してきた」と言っているが、「コンパイラはこれまでにプログラミングを1000倍加速してきた」エビデンスはない。
リーナスの発言意図
現在の AI の過大評価に対する警鐘としての発言だ。しかし「コンパイラはこれまでにプログラミングを1000倍加速してきた」エビデンスがなく、コンパイラの影響力を逆に過大評価している。
現実
画像生成 AI の学習の実例
目次
- PixArt-α
- Stable Diffusion 3
- Lumina-Image 2.0
- HiDream-I1
- SANA
- DiT-Air
- Nitro-T
- Qwen-Image
- Z-Image
- FireRed-Image-Edit-1.0
- Illustrious
T2I 拡散モデルの設計メモ
目次
- 概要
- クラウド GPU
- テキストエンコーダー
- VAE
- GAN
- コンディショニング
- 位置埋め込み
- 目的関数
- Transformer アーキテクチャ
- Transformer を使わないアーキテクチャ
- Gated MLP
- ブロック図
- データセット
- キャプショニング
- スケジューラー
- 学習方法
- Classifier Free Guidance
- Adaptive Projected Guidance
- Reinforcement Learning Guidance
- タイムステップスケジューラー
- ノイズスケジューラー
- 蒸留
- 画像編集
- 省メモリ学習
- 性能検証
- 高速化
- ワーキングメモリー
- 教師ありファインチューニング
- 強化学習
- 丸暗記の仕組み
【NSFW 注意】ComfyUI で circlestone-labs の Anima を使う
A1111系列はforge-neoが対応している(Anima #738)。
Anima は軽量で NSFW の絡みが出せるのが特徴だ。
しかしテキストエンコーダーが 0.6B しかない(現在の軽量モデルは 4B を使うのが主流)ので細かい指示はできない。たとえばダンボールデータセットにないポーズは自然言語でポーズを指定できなかったり、タグの伝染が起こったり、プロンプトが長くなると指示が守られなかったりする。
ただしテキストエンコーダーの能力が低くても、個数指定や左右指定ぐらいはできる。例えば thigh strap の個数や左右位置を指定できたり、左右非対称の衣装を固定したりできる。
Anima はダンボールデータセットにあるポーズしか出せないし、ダンボールデータセットにあるオブジェクトしか描けない。Z-Image や FLUX.2 klein は自然言語でポーズを指示でき、多様なオブジェクトを知っているが、Anima はテキストエンコーダーもモデルも貧弱かつ、データセットが偏っているので汎用性がない。
なので Anima だけですべての作業をするのではなく、ダンボールタグ外の要素は FLUX.2 klein や Qwen Image Edit のような編集モデルを使う割り切りが必要。
アーティストタグを使うなら以下のワークフローはすでに実用レベル:
- Anima で下絵
- アップスケール
- Illustrious の派生モデルで i2i (ディティールの追加・シャープネスアップ・画風の固定)
- SAM2 や SAM3 でセグメンテーション(なくてもいい)
- Illustrious の派生モデルで Detailer
目次
- 利点
- 欠点
- モデル
- ワークフロー
- 設定
- プロンプト
- タグと自然言語との使い分け
- 画力を上げる
- タグの記述順
- クオリティタグ
- 自然言語
- タグの伝染
- 強調構文
- 枠・帯
- 面積制御
- 顔の影対策
- テキストレンダリング
- コマの位置の指定
- ComfyUI のプロンプト編集機能
- コンマの後ろのスペースは必須
- オノマトペ
- tips
- 作例
- LoRa 作成
LLM を使ったストーリー作成
LLM を使ったストーリー作成が一発でうまくいく事はない。なので、ストーリー作成の各工程ごとにアイデア出しの補助をさせることでストーリーを作成する。
AI のべりすとは日本語が使えるが性能は高くない。無料で公開されているローカル実行できる LLM を英語で使ったり、Chat GPT を使う方が効率がいい。AI のべりすとの強みはアダルト文章を日本語で出力できることだ。
モデルについてはおすすめの日本語対応ローカル大規模言語モデルを参照。有名なものでは:
- gpt-oss-20b
- gemma3 27b
- mistral-3.1 24b
- Qwen 3 14b
- nemotron-nano-9b-v2-japanese
目次
よく検索されているプロンプト(R18)
動画生成 AI に関するメモ
目次
クリエイター関係の法律に関するよくある誤解
目次
- 「請負契約は口頭でも成立する」は証拠が不要という意味ではない
- 著作権は譲渡できる
- 著作者人格権は制限できる
- 「著作権侵害は親告罪なので起訴されてないならば適法」は間違い
- 「白黒を判定する権利があるのは著作権者」は間違い
- 「著作権法はアイデアを保護しない」は間違い
- 「ゾーニングされているSNSだから公衆にはあたらない」は間違い
- 企業内複製・業務上の複製(漫画家が資料として画像をダウンロード)も複製権侵害になる
- 教育のための複製でも著作権者への補償金が必要
- 写真のトレースが著作権侵害になる可能性はある
- イラストのトレース検証で名誉棄損が認定された判例がある
- 「無許諾で二次的著作物を作成したが、私的利用が目的のため著作権侵害にはならない」は間違い
- 「他人のイラストを参考にしてイラストを作成したが、ポーズや構図を変えているから著作権侵害にはあたらない」は間違い
- 「無許諾で二次的著作物を作成したが、特定少数にだけ公開しているので著作権侵害にはあたらない」は間違い
- 日本ではパロディは著作権侵害になる可能性が高い
- 「非営利なら無許諾で二次創作を公開・頒布しても適法」は間違い
- キャラクターに著作権は発生しない
- AI による画像生成
- 「AI が生成した画像に著作権は発生しない」は間違い
- 「プロンプトには著作権がない」は間違い
- 「生成AIの出力は依拠の立証ができないので適法」は間違い
- 新橋玉木屋事件(煮豆売り事件)
- 生成AIの利用者も著作権侵害になる
- 生成 AI を用いたサービス提供を行う事業者が著作権侵害になるケース
- 無版権二次創作同人誌の無断転載事件
- 不正競争防止法による模倣の判例
- 写真素材に依拠して作成されたが著作権侵害が否定された判例がある
- 自炊代行は複製権の侵害になる
- コンビニコピー機(ネットプリント含む)で他人の著作物を複製すると複製権の侵害になる
- 外部リンク
「請負契約は口頭でも成立する」は証拠が不要という意味ではない
請負は諾成契約であり契約書の作成は不要である(民法第632条)。請負契約は口頭でも成立するが、裁判でそれを主張するには口頭で契約した証拠(録音・第三者の証言・メールのやりとり等)が必要になる。契約の立証責任は「契約が存在する」と主張する側にあるため、契約書を作るのが確実だ。
著作権は譲渡できる
譲渡できないのは著作者人格権だ(59条)。著作権の譲渡は61条に定められている。
著作者人格権は制限できる
中山信弘著『著作権法』(有斐閣,2007年)p. 364 では以下のように解説している。
著作者人格権には一般的人格権に相当するものも包含されており、著作者人格権の全てを、財産権と同様な意味で放棄可能とする解釈は採りえないであろう。他方実務においては、必要に迫られて、著作者人格権の不行使特約を締結する例も多いが、未だ司法の確定的な判断はなく、疑心暗鬼の中で実務は進んでいる状況と言えよう。今後は、放棄の態様に応じた検討が必要である。
公表権を制限する契約は一般的だ。たとえば、未発表のゲームのテキストの翻訳を下請けに出すとする。下請けが、その翻訳をゲーム発表前に公表すると問題になる。つまりリークを防ぐために、公表権を制限する必要がある。
同一性保持権を制限する契約も多い。イラストの色調を補正したりトリミングしたりして、イラストを使用することがよくあるからだ。
外部リンク
改変への包括的な黙示の同意と同一性保持権―食品包装デザイン事件― 東京地裁判平成29. 11. 30平成28年(ワ)23604号[食品包装デザイン]
「著作権侵害は親告罪なので起訴されてないならば適法」は間違い
Qwen Image Edit 2511 を ComfyUI で実行する+プロンプトリスト
目次
- 特徴
- 概要
- ComfyUI のアップデート
- モデル
- ワークフロー
- 動作速度
- 解像度リスト
- keypoint pose 編集
- 日本語のレンダリング
- プロンプト
- 入力画像認識
- 知っておくべき2種類のプロンプトパターン
- プロンプトガイド
- Qwen-Image-Edit-2509 公式プロンプト例
- Qwen-Image-Edit-2511 公式プロンプト例
- カメラアングル変更 LoRa
- Mask Editor
- 作例