img2img実践ガイド — 元画像を活かして思い通りに仕上げる
AI画像生成のimg2img(画像から画像)の仕組みと使いどころを実践的に解説。denoising strengthの調整、ラフ画からの清書、写真の画風変換、よくある失敗の回避までまとめます。
text2img(テキストから生成)が「ゼロから描く」なら、img2img(画像から生成)は「下絵を渡して描き直してもらう」手法です。構図を自分でコントロールできるため、当たりを引くまでガチャを回すより圧倒的に効率的です。本記事では img2img の仕組みと実践的な使いどころを解説します。
生成全体の流れはAI画像生成のワークフロー設計、構図の厳密制御はControlNet実用ガイドもあわせてご覧ください。
img2img の仕組み
img2img は、元画像にノイズを加えてから、プロンプトに沿って描き直します。どれだけ元画像を残すかを決めるのが denoising strength(変化の強さ)です。
| denoising strength | 効果 |
|---|---|
| 0.2〜0.4 | 元画像をほぼ維持。色味・質感の微調整向け |
| 0.5〜0.6 | 構図は保ちつつ画風を変える。最も使う帯 |
| 0.7〜0.85 | 大胆に変化。ラフから清書、別物への変換 |
| 0.9〜1.0 | ほぼ text2img と同じ(元画像の影響が薄い) |
この一つの数値が img2img の肝です。狙いに応じて段階的に試すのが基本です。
使いどころ1:ラフ画から清書
手描きのラフや簡単な落書きを元画像にし、denoising strength 0.6〜0.8 で清書させます。構図・ポーズを自分で決められるので、text2img のポーズガチャから解放されます。
(元画像:棒人間のラフ)
prompt: a girl in a school uniform, standing, detailed illustration, masterpiece, best quality
denoising strength: 0.7
使いどころ2:写真の画風変換
実写写真をアニメ調・油絵調に変換します。denoising strength 0.5〜0.65 で構図を保ちつつ画風だけ変えるのがコツです。
(元画像:風景写真)
prompt: anime style, vibrant colors, studio ghibli inspired landscape
denoising strength: 0.55
画風語の選び方は画風・アーティスト指定の効かせ方を参照してください。
使いどころ3:生成画像のブラッシュアップ
text2img で出した画像を img2img に通し、低めの denoising strength(0.3〜0.45)でディテールを足したり、好みに寄せたりします。アップスケール前の中間工程として有効です。
サービス別の呼び名
img2img の概念は多くのサービスにありますが、名前や操作が異なります。
- SDXL系(WebUI/ComfyUI):そのまま「img2img」タブ
- Midjourney:画像URLをプロンプト先頭に置く「image prompt」、
--iwで影響度を調整 - Flux/その他:参照画像入力やリミックス機能として実装
タグ型モデルでの細かな指定はStable Diffusion / Flux / Midjourney 書き分けの実践も参考になります。
よくある失敗と回避
| 失敗 | 原因 | 回避 |
|---|---|---|
| 元画像と変わらない | strength が低すぎ | 0.1刻みで上げる |
| 別物になりすぎる | strength が高すぎ | 0.5前後に下げる |
| 構図が崩れる | strength高×プロンプト不一致 | プロンプトを元画像に合わせる |
| 色が濁る | 反復しすぎ | 中間出力を保存し回数を抑える |
まとめ
- img2img は「下絵を渡して描き直す」手法。構図を自分で握れる
- 肝は denoising strength。0.5前後を基準に0.1刻みで調整
- ラフ清書・画風変換・ブラッシュアップが主な使いどころ
img2img のプロンプト部分(画風・品質・ネガティブ)はPromptForge JP のツールで組み立て、元画像と一緒に各サービスへ渡すとスムーズです。まずは strength 0.55 から試してみてください。