PromptForge JP
← ブログ一覧
画像AI

img2img実践ガイド — 元画像を活かして思い通りに仕上げる

AI画像生成のimg2img(画像から画像)の仕組みと使いどころを実践的に解説。denoising strengthの調整、ラフ画からの清書、写真の画風変換、よくある失敗の回避までまとめます。

text2img(テキストから生成)が「ゼロから描く」なら、img2img(画像から生成)は「下絵を渡して描き直してもらう」手法です。構図を自分でコントロールできるため、当たりを引くまでガチャを回すより圧倒的に効率的です。本記事では img2img の仕組みと実践的な使いどころを解説します。

生成全体の流れはAI画像生成のワークフロー設計、構図の厳密制御はControlNet実用ガイドもあわせてご覧ください。

img2img の仕組み

img2img は、元画像にノイズを加えてから、プロンプトに沿って描き直します。どれだけ元画像を残すかを決めるのが denoising strength(変化の強さ)です。

denoising strength 効果
0.2〜0.4 元画像をほぼ維持。色味・質感の微調整向け
0.5〜0.6 構図は保ちつつ画風を変える。最も使う帯
0.7〜0.85 大胆に変化。ラフから清書、別物への変換
0.9〜1.0 ほぼ text2img と同じ(元画像の影響が薄い)

この一つの数値が img2img の肝です。狙いに応じて段階的に試すのが基本です。

使いどころ1:ラフ画から清書

手描きのラフや簡単な落書きを元画像にし、denoising strength 0.6〜0.8 で清書させます。構図・ポーズを自分で決められるので、text2img のポーズガチャから解放されます。

(元画像:棒人間のラフ)
prompt: a girl in a school uniform, standing, detailed illustration, masterpiece, best quality
denoising strength: 0.7

使いどころ2:写真の画風変換

実写写真をアニメ調・油絵調に変換します。denoising strength 0.5〜0.65 で構図を保ちつつ画風だけ変えるのがコツです。

(元画像:風景写真)
prompt: anime style, vibrant colors, studio ghibli inspired landscape
denoising strength: 0.55

画風語の選び方は画風・アーティスト指定の効かせ方を参照してください。

使いどころ3:生成画像のブラッシュアップ

text2img で出した画像を img2img に通し、低めの denoising strength(0.3〜0.45)でディテールを足したり、好みに寄せたりします。アップスケール前の中間工程として有効です。

サービス別の呼び名

img2img の概念は多くのサービスにありますが、名前や操作が異なります。

  • SDXL系(WebUI/ComfyUI):そのまま「img2img」タブ
  • Midjourney:画像URLをプロンプト先頭に置く「image prompt」、--iw で影響度を調整
  • Flux/その他:参照画像入力やリミックス機能として実装

タグ型モデルでの細かな指定はStable Diffusion / Flux / Midjourney 書き分けの実践も参考になります。

よくある失敗と回避

失敗 原因 回避
元画像と変わらない strength が低すぎ 0.1刻みで上げる
別物になりすぎる strength が高すぎ 0.5前後に下げる
構図が崩れる strength高×プロンプト不一致 プロンプトを元画像に合わせる
色が濁る 反復しすぎ 中間出力を保存し回数を抑える

まとめ

  • img2img は「下絵を渡して描き直す」手法。構図を自分で握れる
  • 肝は denoising strength。0.5前後を基準に0.1刻みで調整
  • ラフ清書・画風変換・ブラッシュアップが主な使いどころ

img2img のプロンプト部分(画風・品質・ネガティブ)はPromptForge JP のツールで組み立て、元画像と一緒に各サービスへ渡すとスムーズです。まずは strength 0.55 から試してみてください。