AI画像生成のワークフロー設計 — 構想からアップスケールまでの全工程
高品質な画像を安定的に生成するには、プロンプト以外の工程設計が決め手になります。構想→生成→Inpaint→アップスケール→仕上げの全工程を、各段階のツール選定とコツとセットで解説します。
良いプロンプトを書けるようになっても、それだけでは「使える画像」は作れません。AI画像生成は本質的に「プロンプト → 生成 → 修正 → 仕上げ」の多段ワークフローで、それぞれの段階で適切なツールと判断が必要です。本記事では、商用品質を狙うときの全工程を整理します。
ワークフローの全体像
1. 構想・リファレンス収集
2. プロンプト設計
3. 初期生成(複数バリエーション)
4. ベスト版の選定
5. Inpaint で局所修正
6. アップスケールで高解像度化
7. Photoshop / Affinity で最終仕上げ
8. 用途別のエクスポート
各段階の役割と、よくある落とし穴を順に見ていきます。
1. 構想・リファレンス収集
最初のフェーズですが、ここで品質の8割が決まります。
やるべきこと
- 何を作りたいか、解像度・縦横比・用途まで決める
- リファレンス画像を5〜10枚集める(Pinterest、ArtStation、写真共有サイト)
- 似た構図・似たライティングの作品を分析する
避けるべきこと
- 「とりあえず生成」してから方向性を決める(時間の浪費)
- リファレンスを全く見ずにプロンプトを書く(語彙が狭い)
具体的には、A4 紙を縦に置き、ターゲットの画像と分析メモ(「光は左斜め前から」「画角は腰から上」「彩度は低め」など)を並べて書き出すのが効果的です。
2. プロンプト設計
プロンプトは2〜3案を並列で準備します。同じシーンでも「タグ羅列」「自然言語段落」「ハイブリッド」の3形態を試してみると、モデルの癖が見えます。
設計のチェックリスト
- 被写体は明確か(誰・何が・どう)
- 環境・場所は明示されているか
- ライティングは指定されているか
- 質感・レンズは指定されているか
- 不要な要素は除外されているか(Negative または描写から削除)
- モデル特有の品質タグは適切か
このチェックリストを通すだけで、プロンプトの抜け漏れが減ります。
3. 初期生成(複数バリエーション)
ベスト版を最初の1枚で当てに行かないこと。シードを変えて4〜8枚生成し、その中から方向性を見ます。
おすすめ設定
- バッチサイズ:4〜8(VRAM 次第)
- ステップ数:20〜30(過学習を避ける)
- CFG Scale:6〜8(モデル次第)
- サンプラー:DPM++ 2M Karras(汎用) / Euler a(高速試作)
ここでは「最高傑作を作る」より「方向性を確認する」が目的。雑に大量に出して、傾向を掴む。
4. ベスト版の選定
生成された8枚から、「修正で完成形に持っていけそうな1〜2枚」を選びます。
選定基準
- 全体構図が意図通りか(構図は後から大きくは直せない)
- 主要被写体の顔・手が大きく崩れていないか(局所修正で直せる)
- ライティング・色味が方向性に合っているか
- 背景の整合性(細部の歪みは Inpaint で直せる)
「直せる崩れ」と「直せない崩れ」を見分けることが大事。構図がダメなら捨て、細部がダメなら採用。
5. Inpaint で局所修正
ベスト版に局所的な問題(手が破綻、目の左右非対称、背景の歪みなど)があれば、Inpaint で修正します。
Inpaint の基本手順
- 修正したい箇所をマスク
- その箇所だけを再生成(denoising strength 0.5〜0.7)
- プロンプトを修正部分だけに絞り直す(例:手だけなら「natural human hand, five fingers」)
- 4〜8枚生成して、最もマッチするものを選定
コツ
- マスクは少し大きめに(縁の境界が綺麗になる)
- denoising strength を上げすぎると元の文脈を失う(0.6前後が無難)
- 顔の修正には ADetailer(顔自動 Inpaint)を活用
- 手の修正には Hand Refiner / 手専用 LoRA
6. アップスケールで高解像度化
最終出力解像度に応じてアップスケールします。
おすすめアップスケーラー
- 4x-UltraSharp — 写実調全般
- R-ESRGAN 4x+ Anime6B — アニメ調
- SwinIR — 細部を残しつつスケール
- SUPIR — 大幅な高解像度化(4K以上)に強い
おすすめワークフロー
- 1024×1024 で生成
- 2x アップスケール(→ 2048×2048)
- 必要なら再 Inpaint で細部追加
- もう1回アップスケール(→ 4096×4096)
一気に4xでスケールすると細部が潰れることがあるため、2x → 2x の段階的アップスケールが安全。
7. Photoshop / Affinity で最終仕上げ
AI生成画像をそのまま使うのではなく、最終仕上げを画像編集ソフトで行うのがプロの工程。
仕上げの典型作業
- 色調補正(カラーグレーディング)
- 局所コントラスト調整
- ノイズ・グレインの追加・除去
- 不要要素のスタンプ消し
- 背景合成
- テキスト追加
AI画像は「全体的に均質」「立体感が弱い」傾向があるため、覆い焼き・焼き込みで明暗を強めるだけでも一気にプロっぽくなります。
8. 用途別エクスポート
用途に応じて適切な解像度・形式でエクスポート。
| 用途 | 推奨形式 | 解像度 |
|---|---|---|
| Web表示 | WebP(quality 85) | 1920×1080程度 |
| 印刷 | TIFF / PNG | 350dpi、A3なら 4961×3508 |
| SNS | JPEG(quality 90) | 1080×1080程度 |
| アーカイブ | PNG / TIFF | フル解像度 |
メタデータ(プロンプト、シード、モデル)を保持するか削除するかも、用途次第で判断。
ツール構成の参考例
個人クリエイター向け(コスト低)
- 生成:A1111 Stable Diffusion WebUI(ローカル)
- Inpaint:A1111 内蔵
- アップスケール:A1111 + 4x-UltraSharp
- 仕上げ:Affinity Photo(買い切り)
プロ向け(品質重視)
- 生成:ComfyUI(柔軟なワークフロー)
- Inpaint:ComfyUI + ADetailer
- アップスケール:SUPIR
- 仕上げ:Adobe Photoshop + Lightroom
商用大量生産向け
- 生成:API(Flux Pro / Midjourney API)
- Inpaint:手動 + 自動化スクリプト
- アップスケール:Topaz Gigapixel AI(商用品質)
- 仕上げ:Photoshop アクション化で量産
失敗しやすいパターン
1. プロンプトに固執しすぎ
プロンプトを20回書き直すより、5回試して気に入った1枚を Inpaint で修正する方が早く完成形に到達することが多い。
2. Inpaint をスキップしてプロンプトで全解決を狙う
顔・手の崩れはプロンプトでは確率を下げられるだけで、ゼロにはできません。Inpaint で直す前提で生成回数を抑える方が効率的。
3. アップスケール一発勝負
低解像度の生成物を一気に8xアップスケールすると、ディテールが捏造されすぎて破綻します。段階的なスケールアップが基本。
4. 仕上げを省略する
AIだけで完成させようとすると、どこか「AI臭い」仕上がりになります。最後に必ず画像編集ソフトで一手間かける。
時間配分の目安
商用品質の1枚に投じる時間配分(参考):
- 構想・リファレンス:15分
- プロンプト設計:10分
- 初期生成と選定:20分
- Inpaint:30分
- アップスケール:10分
- 仕上げ:30分
合計2時間弱。これを「プロンプトだけで30分」に短縮しようとすると、品質が頭打ちになります。
まとめ
AI画像生成は「プロンプト工房」ではなく「ワークフロー設計」の世界です。生成・Inpaint・アップスケール・仕上げの4工程を、それぞれ最適なツールで処理する。プロンプトは出発点に過ぎず、完成形までの道のりは段階的なリファインで作られます。
PromptForge JP は「プロンプト設計の入り口」を効率化するツールですが、その先のワークフローまで一貫して支援する設計を見据えています。生成パラメータ、Inpaint用の局所プロンプト、アップスケール推奨設定までを1つの「レシピ」として保存できる、というのが目指す姿です。