VRAM 8 GB・ComfyUI で NetaYume-Lumina-Image-2.0
カテゴリ:deeplearning
NetaYume-Lumina-Image-2.0 の特徴
- VRAM 8 GB・RAM 32 GB で 2k の画像が生成可能
- 自然言語でキャラの描き分けが可能
- danbooru tag と日本語とを混在させたプロンプトも機能する
- アップスケールなしで、2k の出力が可能
- イラストレータータグ対応
- キャラタグ対応
- nsfw 対応
- LoRA の作成がそれほど困難ではない(ai-toolkit で LoRA を作成可能)
- 英文がそこそこ描ける
欠点
- 現状の画質は Illustrious のマージモデルに劣る
- 生成に時間がかかる。RTX3050 8 GB で
- 1,536 x 2,048:7 分 30 秒
- 1,536 x 1,536:5 分
- 1,024 x 1,536:3 分
- 手がよく溶ける
- 背景の一貫性維持が苦手(水平線がずれる)
- 文字の描写は不完全
- 漢字や日本語の描写は未対応
- nsfw の絡みが下手
モデル
NetaYumev35_pretrained_all_in_one.safetensors をmodels/checkpoints に配置し、ComfyUI に Lumina_image_v2_tensorart_workflow.json をドラッグする。
NetaYumev35_pretrained_all_in_one.safetensors に Gemma-2-2b と DiT と FLUX.1 dev VAE とがすべて含まれている。
スタイル
Neta Lumina Prompt Book
Lumina Image 2.0 のテキストエンコーダーである Gemma 2b は日本語も対応しているが、可能なら danbooru タグを使うのが確実。
テンプレート
You are an assistant~<Prompt Start> はあった方がいい。
You are an assistant designed to generate anime images based on textual prompts. <Prompt Start> キャラ 画風 キャラの外見 服装 表情・アクション カメラ・位置 ライティング・エフェクト シーンの雰囲気 クオリティタグ 自然言語で補足
システムプロンプトのバリエーション
基本
You are an assistant designed to generate anime images based on textual prompts. <Prompt Start> 1girl, long hair, beautiful detailed eyes, sitting under cherry blossom tree
ダンボールタグ
You are an assistant designed to generate anime images with the highest degree of image-text alignment based on danbooru tags. <Prompt Start>
自然言語
You are an assistant designed to generate high-quality images with the highest degree of image-text alignment based on textual prompts. <Prompt Start>
構造化プロンプト
You are an assistant designed to generate high-quality images with the highest degree of image-text alignment based on structural summary. <Prompt Start>
ネガティブプロンプト
基本
You are an assistant designed to generate low-quality images based on textual prompts <Prompt Start> blurry, worst quality, low quality, deformed hands, bad anatomy, extra limbs, poorly drawn face, mutated, extra eyes, bad proportions
上級
You are an assistant designed to generate low-quality images based on textual prompts. <Prompt Start> blurry, worst quality, low quality, jpeg artifacts, signature, watermark, username, error, deformed hands, bad anatomy, extra limbs, poorly drawn hands, poorly drawn face, mutation, deformed, extra eyes, extra arms, extra legs, malformed limbs, fused fingers, too many fingers, long neck, cross‑eyed, bad proportions, missing arms, missing legs, extra digit, fewer digits, cropped, normal quality
生成パラメータ
項目 | 設定 |
---|---|
サンプラー | res_multistep euler_ancestral |
スケジューラー | linear_quadratic |
ステップ数 | 30 以上 |
CFG | 4~5.5 |
解像度 | 1024×1024 768×1532 968×1322 |
公式
以下の +: で囲まれた見出しはプロンプトに入れなくていい。
任意のシステムプロンプト + Character: 1girl, 2boys, character name + Art‑Style: pixel style, impasto + Character Appearance: hair & eye colour, unique traits + Clothing: uniforms, accessories, materials + Expression & Action: mood, pose, gesture + Camera / Perspective: close‑up, upper body, bird’s‑eye,etc. + Lighting & Effects: lighting flares, particles, magic circles + Scene Atmosphere: environment, ambience keywords + Quality Tag: best quality
例
You are an assistant designed to generate anime images based on textual prompts. <Prompt Start> neta, 1girl, solo, bangs, black hair, purple eyes, multicolored hair, virtual youtuber, hair bun, streaked hair, double bun, school uniform, white shirt, pleated skirt, gentle smile, looking at viewer, sitting, upper body, close‑up, soft lighting, depth of field, cherry blossom background, warm lighting, best quality
1girl, solo, full body, standing, A beautifully designed anime character standing in a confident pose with detailed costume design and expressive features. Her outfit shows intricate patterns and flowing fabric that moves naturally with her posture. The character design emphasizes elegance and personality through careful attention to accessories, color coordination, and a distinctive silhouette. clean background, character design, full body illustration, best quality
ベストプラクティス
あいまいな形容詞を避ける
✖: beautiful girl
〇:A girl with flowing silver hair that catches the moonlight
記述した方がいい項目
項目 | 例 |
---|---|
位置関係 | standing at the top of stairs, sitting under the tree |
視線 | looking down at viewer, gazing upward at the sky |
感情 | with a confident smile, mysterious expression |
空気感 | in a dreamlike atmosphere, surrounded by magical sparkles |
質感 | silk-like hair, crystalline dress |
動き | hair swaying in the breeze, petals falling around her |
LLM を使用したプロンプト生成
推奨モデル:Gemini 2.5 Pro, GPT‑o3, Claude 4。ローカルなら gpt-oss-20b。
超長いプロンプトを見る
You are a professional AI drawing prompt expert, specializing in creating high-quality prompts for Neta Lumina drawing models. Please strictly follow the following specifications to help me generate prompts: ## Neta Lumina prompt structure specification ### Required system prefix (must be included in each prompt): You are an assistant designed to generate anime images based on textual prompts. <Prompt Start> ### Standard sequence of parts (9 parts):1. Character trigger words (e.g., 1girl, 1boy, 2girls, character name, etc.) 2. Picture style prompt words 3. Character prompt words (appearance) (hair color, eye color, basic features) 4. Character costume prompt (specific costume description) 5. Character expression and action prompts (expression, posture, action) 6. Picture perspective prompt words (angle, range such as upper body, close-up, etc.) 7. Special effects prompts (lighting, special effects) 8. Scene atmosphere prompt (environment, atmosphere) 9. Quality tips (best quality)
### Natural language part standard order (5 parts):1. ** Composition aspect **: picture layout, visual balance, composition principles (such as golden section, symmetrical composition, etc.) 2. **Light and shadow processing**: light source properties, lighting effect, color temperature characteristics, shadow processing 3. **Characteristics and Clothing**: Detailed description of appearance, material and texture of clothing 4. **Scene details**: environmental elements, background objects, spatial atmosphere, narrative function 5. **Artistic style**: Painting techniques, artistic schools, overall style definition
## Important format requirements ### Neta Lumina special grammar: -Underline to space: school*uniform → school uniform -Weight bracket expansion: -The artist tag is reinforced with the @ symbol -Negative prompt words also need the same system prefix ### Quality standards: -The Tag part should be concise and accurate to avoid redundancy -Natural language should be vivid and concrete, with a sense of picture -The overall description should be logical and clear -Ensure that Tags complement and do not duplicate natural language ## Creative tasks [My creative idea]: {type in your creative idea here} [Specific requirements]: {Enter special requirements here, such as style preference, emotional tone, technical requirements, etc.} ## Please help me complete the following tasks:1. ** Analyze the idea **: Understand my creative intention and core elements 2. **Structural planning**: Organize Tag and natural language content in the standard order 3. **Generate prompt words**: Create complete Neta Lumina format prompt words 4. **Provide variants**: If necessary, provide 2-3 versions from different angles 5. **Optimization Suggestions**: Give specific suggestions for further improvement
## Output format example
**Full prompt:** You are an assistant designed to generate anime images based on text prompts. <Prompt Start> [complete Tag section, strictly in the order of 9 paragraphs], [complete natural language section, strictly in the order of 5 paragraphs] Example: You are an assistant designed to generate anime images based on text prompts. <Prompt Start> 1girl, lineart, greyscale, yoneyama mai, solo, long red hair, green eyes, business casual, blazer, blouse, contemplative expression, leaning on railing, wind blown hair, back view, dramatic sunset, golden hour lighting, lens flare, urban rooftop, city panorama, best quality, The composition utilizes the golden ratio to position the figure against the vast urban sunset, creating a powerful silhouette that speaks to ambition and reflection. Dramatic golden-hour lighting backlights her flowing auburn hair while casting long shadows across the rooftop, with lens flares adding cinematic drama to the sky. Her professional attire - a tailored charcoal blazer over a silk blouse - moves naturally in the evening breeze, the fabrics rendered with attention to how wind affects different materials. The cityscape extends to the horizon, featuring architectural details of glass towers, traditional buildings, and infrastructure that tells the story of urban development. The artistic approach combines architectural photography principles with character-focused narrative illustration. **Structure analysis:** -Tag part parsing: [Briefly explain the function of each part] -Natural language parsing: [explain the focus of each section] -Style features: [highlight the uniqueness of this prompt] Please start helping me create prompts now.
作例
公式の作例は Neta Lumina Prompt Book#advanced-techniques を参照。
quality 72 の jpg 圧縮なので、実際の画質はもっと良い。
設定
- steps:30
- cfg:5
- サンプラー:euler_ancestral
- スケジューラー:linear_quadratic
以下の共通ネガティブプロンプトを使用。
You are an assistant designed to generate low-quality images based on textual prompts <Prompt Start> bad quality,worst quality,worst detail,sketch,censor, simple background,transparent background
作例
You are an assistant designed to generate high-quality images with the highest degree of image-text alignment based on textual prompts. <Prompt Start> アーティストタグ, vibrant colors, english text, front-facing, full body, soft lighting, humorous mood, masterpiece, best quality, amazing quality, indoors. 3人の女の子がいます。 左の女の子は赤いショートヘアー、青い目で、"左"と描かれたカードを持って座っています。 真ん中の女の子は銀のロングヘアー、赤い目で、"中"と描かれたカードを持って立っています。 右の女の子は茶色のミドルヘアー、緑の目で、"右"と描かれたカードを持って座っています。
You are an assistant designed to generate anime high-quality images with the highest degree of image-text alignment based on textual prompts. <Prompt Start> 1girl, lineart, greyscale, yoneyama mai, solo, long red hair, green eyes, business casual, blazer, blouse, contemplative expression, leaning on railing, wind blown hair, back view, dramatic sunset, golden hour lighting, lens flare, urban rooftop, city panorama, best quality, 黄金比を用いて人物を広大な都市の夕焼けに配置し、野心と内省を象徴する力強いシルエットを形作っている。 ゴールデンアワーのドラマチックな逆光が、流れるような赤褐色の髪を捉え、映画的なレンズフレアと共に屋根の上に長い影を落とす。 シルクブラウスに羽織ったチャコールグレーのテーラードブレザーは、風を受けて自然に波打つ。布地の風による動きが細部まで表現されている。 ガラス張りの高層ビルと歴史的建造物が広がるスカイラインは、都市の発展を物語っている。 このスタイルは、建築写真の手法と人物中心の物語性のあるイラストレーションを融合させている。
You are an assistant designed to generate high-quality images with the highest degree of image-text alignment based on textual prompts. <Prompt Start> Whimsical anime-style illustration. Medium shot with a warm pastel color palette. ふわふわしたピンクの雲の青空の下、ビーチで男の子と女の子とが隣り合って座っている。 青い短髪の少年は、ピンクの花柄の鮮やかな青のハワイアンシャツと濃い色のショートパンツを緩く着ている。彼はくつろいだ姿勢で座り、少女に優しく微笑んでいる。 少女は銀青色の長いツインテールと妖精のような耳を持ち、袖なしの白いクロップトップと短いフリルスカートを身につけ、髪には黄色い花を挿している。彼女は小さなメモかカードを胸元に抱え、大きなピンクの瞳で少年を見つめている。 二人の間にはカラフルなミニチュア旗とおもちゃの風車が付いた砂の城が築かれ、近くをカモメが飛び交い止まっている。この光景は夏の魔法のような感覚を生み出している。右側では縞模様のパラソルが部分的に影を落としている。漂う花びら、スイカの切り身、きらめきが夢のようなビーチの情景を引き立てている。イラストは柔らかな光、絵画的な質感、そして温もり、驚き、無垢な愛情に満ちた幻想的な雰囲気を帯びている。
You are an assistant designed to generate high-quality images with the highest degree of image-text alignment based on textual prompts. <Prompt Start> scenery, tree, outdoors, snow, autumn, mountain, veranda, sunset, winter, autumn_leaves, sky, leaf, water, wide_shot, cloud, east_asian_architecture, lingering_maple_leaves, snow-capped_mountains,curved_eaves, half-frozen_stream, tiered_roofline, dusk_hues, paper_lanterns, tranquil_composition A wide shot captures a snow-dusted East Asian veranda overlooking mountains where autumn leaves cling to branches above a half-frozen stream. Sunset bleeds peach and lavender across the sky, backlighting clouds drifting over tiered rooflines with curved eaves. Paper lanterns glow softly on the veranda as maple leaves float onto snowbanks, merging seasonal transitions into one harmonious panorama.
jack-o' challenge タグを認識しないが、自然言語でポーズを指示できる。
You are an assistant designed to generate high-quality images with the highest degree of image-text alignment based on textual prompts. <Prompt Start> アーティストタグ, 1girl, yuzuki yukari, jack-o' challenge, top-down bottom-up, indoors, rug, potted plant, window, book shelf, best quality. 彼女は肘を床につき、脚を広げて、尻を上げたポーズをとっています。
You are an assistant designed to generate high-quality images with the highest degree of image-text alignment based on textual prompts. <Prompt Start> アーティストタグ, 2girls, hand on another's head, onee-loli, outdoors, road, best quality. 女性と女の子が立っています。 左側のドレスを着た成人女性は、困ったような表情で右側の女の子の頭の上に手をのせています。 右側の女の子は泣いています。手にはアイスクリームのコーンを持っています。 道路にはアイスクリームが落ちています。 イラストは夕方の都会で柔らかな光、温もりを帯びている。
You are an assistant designed to generate high-quality images with the highest degree of image-text alignment based on textual prompts. <Prompt Start> djeeta \(granblue fantasy\), official art, best quality. 画面の中央でピンクのドレスとシルバーのガントレット、革のブーツをはいた djeeta \(granblue fantasy\) が両手で剣を持っている。彼女は手を肩のあたりまであげ、剣先は右側を指している。 青空に白い雲があり、背景にドラゴンが飛んでいる。
学習情報
- 画像枚数 1,300 万枚
- 学習時間 46,000 A100 Hours