AIでショート動画を1人で作る方法【台本→キャラ→動画の全工程を公開】

エリンギちゃんがパソコンの前にいる画像 AI動画制作

「AI動画って自分でも作れるの?」と思ったことはありませんか。

わたし(エリンギ)は、AIを使ってショートアニメ動画を1人で作っています。キャラクターのデザイン、台本、動画生成、すべてAIツールを組み合わせて完結させています。

この記事では、台本を作るところから動画を投稿するまでの全工程を、実際に使っているツールとともに公開します。

特別なスキルは必要ありません。わたし自身、動画制作の経験はゼロからスタートしました。


この記事でわかること

  • AI動画を1人で作る4つのステップ
  • 実際に使っているツールと役割
  • 台本・キャラクター・動画それぞれの作り方のコツ
  • 初心者がつまずきやすいポイントと対策

使っているツール一覧

まず全体像として、使っているツールをまとめます。

工程使うツール費用目安
台本作成ChatGPT無料〜月額$20
キャラクター画像生成ChatGPT(DALL-E)/ Gemini無料〜月額$20
動画生成Veo3(Google)、Frow従量課金
動画編集・投稿CapCut / スマホ標準アプリ無料〜

すべてスマホだけでも動かせますが、画像生成やVeo3はパソコンのほうが操作しやすいです。


全工程の流れ(4ステップ)

大きな流れはこのとおりです。

  1. 台本を作る(ChatGPTやGeminiで)
  2. キャラクターと背景の画像を作る(画像生成AIで)
  3. 動画を生成する(Veo3で)
  4. 編集して投稿する

1本の動画を作るのにかかる時間は、慣れてくると1〜2時間程度です。最初は慣れるまで半日かかることもあります。

エリンギちゃんが工程を説明している画像

ステップ①:台本を作る

なぜ台本が最初なのか

動画のアイデアがあっても、台本がないと画像も動画も作れません。どのシーンに何の画像が必要か、キャラクターが何を言うかが決まってはじめて、次のステップに進めます。

ChatGPTへの依頼のしかた

わたしの場合、ChatGPTに以下のような指示を出しています。

【ChatGPTへの指示例】

YouTube Shorts(60秒以内)用の台本を作ってください。

キャラクター:エリンギちゃん(きのこのキャラクター・のんびり屋)
シチュエーション:コンビニでアルバイト中に〇〇が起きる
トーン:ほのぼの・くすっと笑える
構成:①つかみ(0〜5秒)②本編(5〜50秒)③オチ(50〜60秒)

カット割りも一緒に書いてください。

このように「キャラクター・状況・トーン・構成」を一緒に伝えると、そのまま使える台本が出てきます。

台本に含めると便利な情報

台本には本文だけでなく、以下も一緒にChatGPTに書いてもらいます。

  • カット番号(カット1、カット2…)
  • 各カットの場面説明(どんな画が必要か)
  • キャラクターのセリフまたはナレーション
  • 動き・表情の指定

このカット割りがあると、次の画像生成がスムーズになります。


ステップ②:キャラクターと画像を作る

キャラクターを「固定」するのが最大のコツ

AI動画でいちばん難しいのは、毎回同じキャラクターを生成することです。何も工夫しないと、生成するたびに見た目が変わってしまいます。

わたしが解決した方法は「キャラクター設定書(固定プロンプト)」を作ることです。

エリンギちゃんの場合、画像生成のたびに以下のフレーズを必ずプロンプトに入れています。

a cute small mushroom character with a large round warm-brown mushroom cap,
cream-colored soft plush body, round black dot eyes, pink blush cheeks,
no nose, small round mouth, stubby arms, 3D render, felt toy aesthetic,
soft lighting, warm and cozy atmosphere

この固定フレーズに、シーンごとの指定(「カフェに座っている」「驚いた顔をしている」など)を追加することで、見た目を統一しています。

エリンギちゃんのキャラクター固定の説明画像

使うツールはどれがいいか

キャラクターの一貫性という点では、同じセッション内でChatGPT(DALL-E)を使い続けるのがいまのところいちばん安定しています。Geminiも品質は高いですが、セッションをまたぐと別キャラになりやすいです。

1本の動画に必要な画像の枚数

YouTube Shorts(20秒)の場合、カット数によりますが5枚程度の画像を用意します。Veo3は静止画から動画を生成するため、カットごとに1枚ずつ画像が必要です。


ステップ③:Veo3で動画を生成する

Veo3とは

Veo3はGoogleが提供するAI動画生成ツールです。静止画と指示文(プロンプト)を入力すると、数分で動画クリップを生成してくれます。

2025年時点では、自然な動きの質という点でVeo3が最も優秀だと感じています。

Veo3へのプロンプトの書き方

Veo3には英語でプロンプトを入力します。ポイントは「どんなキャラクターが・どこで・どんな動きをしているか」を具体的に書くことです。

【Veo3プロンプト例】

A small adorable mushroom character named Eringi-chan.
She has a large round warm-brown mushroom cap on a cream-colored soft plush body.
Round black dot eyes, pink blush cheeks, no nose, tiny round mouth.
Very short stubby arms.

She is standing behind a convenience store counter,
looking slightly confused at a product in her hand.
The store is warmly lit. Slow, gentle movement. 3D animation style.

注意点として、Veo3の実行はわたしが手動でやっています。生成には数分かかるため、プロンプトを送ってから待つ時間が発生します。一度に複数のカットを生成しておくのが効率的です。

エリンギちゃんが生成を待っている画像

うまくいかないときの対処法

  • キャラクターの見た目がブレる→固定フレーズを増やす・より詳しく書く
  • 動きが不自然→「slow and gentle movement」など動きの質感を指定する
  • 背景が想定と違う→背景の描写も具体的に書く(色・照明・アイテムなど)

ステップ④:編集して投稿する

編集でやっていること

Veo3で生成した動画クリップをつなげて1本のショート動画にします。編集アプリはCapCutを使っています(無料で使えます)。

編集でやっていることはシンプルです。

  • クリップをカット順に並べる
  • テロップ(字幕)を入れる
  • BGMをつける
  • 冒頭3秒に「つかみ」になるテキストを入れる

YouTube Shortsに投稿するときのポイント

  • タイトルにキーワードを入れる:「〇〇あるある」「〇〇の日常」など
  • サムネイルはキャラクターの顔が大きく映るものを選ぶ
  • ハッシュタグは3〜5個:#Shorts を必ず入れる
  • 投稿時間:夜20〜22時が伸びやすい傾向

まとめ:AI動画制作の4ステップ

エリンギちゃんがスマホを見ている画像

AIでYouTubeショート動画を作る全工程を整理すると、次のとおりです。

  1. 台本を作る:ChatGPTにキャラクター・状況・構成を渡して台本とカット割りを作る
  2. 画像を作る:固定プロンプト+シーン指定で画像生成AIからカットごとの画像を出力する
  3. 動画を生成する:Veo3に画像とプロンプトを入力して動画クリップを生成する
  4. 編集・投稿する:CapCutでクリップをつなぎ、テロップ・BGMを入れてYouTubeに投稿する

最初は慣れるまで時間がかかりますが、工程が決まってくると驚くほどスムーズになります。

各ステップの詳しい解説は個別の記事で書いていきます。気になるものがあればそちらもどうぞ。

タイトルとURLをコピーしました