動画AI2026-05-04

動画プロンプトの構造化 — カメラワーク・尺・動きの指定方法

動画生成AIで意図通りの結果を得るためには、画像とは異なる「動きの指定」が必要です。カメラワーク・尺・被写体の動き・カット指示を構造化する方法を解説します。

動画生成AIは画像生成と根本的に異なる難しさがあります。画像が「ある瞬間」を切り取るのに対し、動画は「時間の経過」を含む。そのため、被写体だけを指示するプロンプトでは安定した結果が出ません。本記事では、動画プロンプトに必要な4つの追加要素を整理し、構造化する方法を解説します。

動画プロンプトの4要素

画像プロンプトの5層（被写体・構図・画風・ライティング・クオリティ）に加えて、動画では次の4要素を明示する必要があります。

カメラワーク — カメラがどう動くか
尺・テンポ — 動画の長さと速度感
被写体の動き — 人や物がどう動くか
カット・トランジション — シーンの切り替え方

これらが指定されないと、AI は「動かないシーン」「カメラが浮遊する不自然な動き」「被写体が固まったような違和感」を出力しがちです。

1. カメラワーク

主要な動詞・概念をプロンプトで使えるように整理します。

移動系

dolly in / dolly out — カメラ前進・後退
pan left / pan right — 左右への振り
tilt up / tilt down — 上下への振り
truck left / truck right — 横移動
pedestal up / pedestal down — 縦移動
tracking shot / follow shot — 被写体に追従
crane shot / aerial shot — クレーン・空撮

焦点・レンズ系

zoom in / zoom out — ズーム
rack focus — フォーカス送り
dutch angle — 斜め構図

静止系

static shot / locked off — カメラ固定
handheld — 手持ち感

カメラワークは1動画に1〜2つに絞るのが推奨。複数の動きを同時に指示すると AI が処理しきれず破綻します。

2. 尺・テンポ

Duration: 5 seconds
Pacing: slow and contemplative
Speed: real-time / slow motion / time-lapse

多くのモデルは生成尺の上限が4〜10秒なので、その範囲で指定。「ゆっくり」「素早く」など速度感は被写体の動きと一致させる必要があります。

スローモーションが効くケース：

高揚感のある瞬間（ジャンプ、スプラッシュ）
細かい動きを見せたいとき
ドラマチックな演出

タイムラプスが効くケース：

雲・空・植物の変化
工程・プロセスの可視化
時間経過を圧縮したいシーン

3. 被写体の動き

被写体の動きを指定しないと、AI は「立ったまま静止」のような不自然な絵を出力しがちです。

例：

A young woman walks slowly toward the camera, occasionally
glancing to the side. Her hair moves naturally in the wind.

ポイントは：

動詞を具体的に：moves ではなく walks slowly、runs across、jumps up
方向を明示：toward camera、away from camera、from left to right
副次的な動き：髪の動き、衣服のなびき、表情の変化など

副次的な動きを1〜2個入れると、シーン全体に「生きてる感」が出ます。

4. カット・トランジション

短尺動画では基本的に1カットですが、複数カットや特殊な切り替えを指定できるモデルもあります。

Single continuous shot, no cuts.

または

Cut from wide shot to close-up at 2 seconds, then back to wide.

SORA はマルチカットを比較的安定して扱える一方、Pika や Kling は1カット推奨。モデル仕様を踏まえて使い分けます。

実践テンプレート

これら4要素を組み合わせた動画プロンプトのテンプレート例：

[被写体・シーン]
A teenage girl with red hair sits on a wooden bench in a park.
Cherry blossoms slowly drift down around her.

[カメラワーク]
Slow dolly-in toward her face, eye-level.

[被写体の動き]
She turns her head to look at the camera at the 3-second mark,
then smiles slightly. Her hair gently moves in a soft breeze.

[尺・テンポ]
6 seconds total, real-time pacing, calm and intimate mood.

[ライティング・画風]
Late afternoon golden light, cinematic, shallow depth of field.

このように構造化すると、AI が解釈しやすく、各要素を後から個別に調整できます。

モデル別の最適化

SORA：散文式に流して書く（テンプレートを連続テキストに変換）
Veo：要素ごとにラベル付きで構造化（テンプレートをそのまま使える）
Kling：動詞と速度を強調（被写体の動きセクションを充実）
Runway：演出・エフェクト寄りの追加要素（フェード、フィルター指定）
Pika：シンプルな1〜2文で集約

まとめ

動画プロンプトは「画像プロンプト + 動きの指示」です。カメラワーク・尺・被写体の動き・カット指示の4要素を意識すると、AI に何を期待しているかが明確に伝わり、出力の安定性が大きく向上します。

PromptForge JP では、これら4要素を選択式 UI で組み立てられる「動画プロンプトモード」を準備中です。カメラワークや動きの動詞を辞書から選ぶだけで、各動画AIモデル向けに最適化されたプロンプトを生成できる設計を目指しています。

← 他の記事を読む