PromptForge JP
← ブログ一覧
プロンプト運用

AI画像生成のワークフロー設計 — 構想からアップスケールまでの全工程

高品質な画像を安定的に生成するには、プロンプト以外の工程設計が決め手になります。構想→生成→Inpaint→アップスケール→仕上げの全工程を、各段階のツール選定とコツとセットで解説します。

良いプロンプトを書けるようになっても、それだけでは「使える画像」は作れません。AI画像生成は本質的に「プロンプト → 生成 → 修正 → 仕上げ」の多段ワークフローで、それぞれの段階で適切なツールと判断が必要です。本記事では、商用品質を狙うときの全工程を整理します。

ワークフローの全体像

1. 構想・リファレンス収集
2. プロンプト設計
3. 初期生成(複数バリエーション)
4. ベスト版の選定
5. Inpaint で局所修正
6. アップスケールで高解像度化
7. Photoshop / Affinity で最終仕上げ
8. 用途別のエクスポート

各段階の役割と、よくある落とし穴を順に見ていきます。

1. 構想・リファレンス収集

最初のフェーズですが、ここで品質の8割が決まります。

やるべきこと

  • 何を作りたいか、解像度・縦横比・用途まで決める
  • リファレンス画像を5〜10枚集める(Pinterest、ArtStation、写真共有サイト)
  • 似た構図・似たライティングの作品を分析する

避けるべきこと

  • 「とりあえず生成」してから方向性を決める(時間の浪費)
  • リファレンスを全く見ずにプロンプトを書く(語彙が狭い)

具体的には、A4 紙を縦に置き、ターゲットの画像と分析メモ(「光は左斜め前から」「画角は腰から上」「彩度は低め」など)を並べて書き出すのが効果的です。

2. プロンプト設計

プロンプトは2〜3案を並列で準備します。同じシーンでも「タグ羅列」「自然言語段落」「ハイブリッド」の3形態を試してみると、モデルの癖が見えます。

設計のチェックリスト

  • 被写体は明確か(誰・何が・どう)
  • 環境・場所は明示されているか
  • ライティングは指定されているか
  • 質感・レンズは指定されているか
  • 不要な要素は除外されているか(Negative または描写から削除)
  • モデル特有の品質タグは適切か

このチェックリストを通すだけで、プロンプトの抜け漏れが減ります。

3. 初期生成(複数バリエーション)

ベスト版を最初の1枚で当てに行かないこと。シードを変えて4〜8枚生成し、その中から方向性を見ます。

おすすめ設定

  • バッチサイズ:4〜8(VRAM 次第)
  • ステップ数:20〜30(過学習を避ける)
  • CFG Scale:6〜8(モデル次第)
  • サンプラー:DPM++ 2M Karras(汎用) / Euler a(高速試作)

ここでは「最高傑作を作る」より「方向性を確認する」が目的。雑に大量に出して、傾向を掴む。

4. ベスト版の選定

生成された8枚から、「修正で完成形に持っていけそうな1〜2枚」を選びます。

選定基準

  • 全体構図が意図通りか(構図は後から大きくは直せない)
  • 主要被写体の顔・手が大きく崩れていないか(局所修正で直せる)
  • ライティング・色味が方向性に合っているか
  • 背景の整合性(細部の歪みは Inpaint で直せる)

「直せる崩れ」と「直せない崩れ」を見分けることが大事。構図がダメなら捨て、細部がダメなら採用。

5. Inpaint で局所修正

ベスト版に局所的な問題(手が破綻、目の左右非対称、背景の歪みなど)があれば、Inpaint で修正します。

Inpaint の基本手順

  1. 修正したい箇所をマスク
  2. その箇所だけを再生成(denoising strength 0.5〜0.7)
  3. プロンプトを修正部分だけに絞り直す(例:手だけなら「natural human hand, five fingers」)
  4. 4〜8枚生成して、最もマッチするものを選定

コツ

  • マスクは少し大きめに(縁の境界が綺麗になる)
  • denoising strength を上げすぎると元の文脈を失う(0.6前後が無難)
  • 顔の修正には ADetailer(顔自動 Inpaint)を活用
  • 手の修正には Hand Refiner / 手専用 LoRA

6. アップスケールで高解像度化

最終出力解像度に応じてアップスケールします。

おすすめアップスケーラー

  • 4x-UltraSharp — 写実調全般
  • R-ESRGAN 4x+ Anime6B — アニメ調
  • SwinIR — 細部を残しつつスケール
  • SUPIR — 大幅な高解像度化(4K以上)に強い

おすすめワークフロー

  1. 1024×1024 で生成
  2. 2x アップスケール(→ 2048×2048)
  3. 必要なら再 Inpaint で細部追加
  4. もう1回アップスケール(→ 4096×4096)

一気に4xでスケールすると細部が潰れることがあるため、2x → 2x の段階的アップスケールが安全。

7. Photoshop / Affinity で最終仕上げ

AI生成画像をそのまま使うのではなく、最終仕上げを画像編集ソフトで行うのがプロの工程。

仕上げの典型作業

  • 色調補正(カラーグレーディング)
  • 局所コントラスト調整
  • ノイズ・グレインの追加・除去
  • 不要要素のスタンプ消し
  • 背景合成
  • テキスト追加

AI画像は「全体的に均質」「立体感が弱い」傾向があるため、覆い焼き・焼き込みで明暗を強めるだけでも一気にプロっぽくなります。

8. 用途別エクスポート

用途に応じて適切な解像度・形式でエクスポート。

用途 推奨形式 解像度
Web表示 WebP(quality 85) 1920×1080程度
印刷 TIFF / PNG 350dpi、A3なら 4961×3508
SNS JPEG(quality 90) 1080×1080程度
アーカイブ PNG / TIFF フル解像度

メタデータ(プロンプト、シード、モデル)を保持するか削除するかも、用途次第で判断。

ツール構成の参考例

個人クリエイター向け(コスト低)

  • 生成:A1111 Stable Diffusion WebUI(ローカル)
  • Inpaint:A1111 内蔵
  • アップスケール:A1111 + 4x-UltraSharp
  • 仕上げ:Affinity Photo(買い切り)

プロ向け(品質重視)

  • 生成:ComfyUI(柔軟なワークフロー)
  • Inpaint:ComfyUI + ADetailer
  • アップスケール:SUPIR
  • 仕上げ:Adobe Photoshop + Lightroom

商用大量生産向け

  • 生成:API(Flux Pro / Midjourney API)
  • Inpaint:手動 + 自動化スクリプト
  • アップスケール:Topaz Gigapixel AI(商用品質)
  • 仕上げ:Photoshop アクション化で量産

失敗しやすいパターン

1. プロンプトに固執しすぎ

プロンプトを20回書き直すより、5回試して気に入った1枚を Inpaint で修正する方が早く完成形に到達することが多い。

2. Inpaint をスキップしてプロンプトで全解決を狙う

顔・手の崩れはプロンプトでは確率を下げられるだけで、ゼロにはできません。Inpaint で直す前提で生成回数を抑える方が効率的。

3. アップスケール一発勝負

低解像度の生成物を一気に8xアップスケールすると、ディテールが捏造されすぎて破綻します。段階的なスケールアップが基本。

4. 仕上げを省略する

AIだけで完成させようとすると、どこか「AI臭い」仕上がりになります。最後に必ず画像編集ソフトで一手間かける。

時間配分の目安

商用品質の1枚に投じる時間配分(参考):

  • 構想・リファレンス:15分
  • プロンプト設計:10分
  • 初期生成と選定:20分
  • Inpaint:30分
  • アップスケール:10分
  • 仕上げ:30分

合計2時間弱。これを「プロンプトだけで30分」に短縮しようとすると、品質が頭打ちになります。

まとめ

AI画像生成は「プロンプト工房」ではなく「ワークフロー設計」の世界です。生成・Inpaint・アップスケール・仕上げの4工程を、それぞれ最適なツールで処理する。プロンプトは出発点に過ぎず、完成形までの道のりは段階的なリファインで作られます。

PromptForge JP は「プロンプト設計の入り口」を効率化するツールですが、その先のワークフローまで一貫して支援する設計を見据えています。生成パラメータ、Inpaint用の局所プロンプト、アップスケール推奨設定までを1つの「レシピ」として保存できる、というのが目指す姿です。