「AI動画って自分でも作れるの?」と思ったことはありませんか。
わたし(エリンギ)は、AIを使ってショートアニメ動画を1人で作っています。キャラクターのデザイン、台本、動画生成、すべてAIツールを組み合わせて完結させています。
この記事では、台本を作るところから動画を投稿するまでの全工程を、実際に使っているツールとともに公開します。
特別なスキルは必要ありません。わたし自身、動画制作の経験はゼロからスタートしました。
この記事でわかること
- AI動画を1人で作る4つのステップ
- 実際に使っているツールと役割
- 台本・キャラクター・動画それぞれの作り方のコツ
- 初心者がつまずきやすいポイントと対策
使っているツール一覧
まず全体像として、使っているツールをまとめます。
| 工程 | 使うツール | 費用目安 |
|---|---|---|
| 台本作成 | ChatGPT | 無料〜月額$20 |
| キャラクター画像生成 | ChatGPT(DALL-E)/ Gemini | 無料〜月額$20 |
| 動画生成 | Veo3(Google)、Frow | 従量課金 |
| 動画編集・投稿 | CapCut / スマホ標準アプリ | 無料〜 |
すべてスマホだけでも動かせますが、画像生成やVeo3はパソコンのほうが操作しやすいです。
全工程の流れ(4ステップ)
大きな流れはこのとおりです。
- 台本を作る(ChatGPTやGeminiで)
- キャラクターと背景の画像を作る(画像生成AIで)
- 動画を生成する(Veo3で)
- 編集して投稿する
1本の動画を作るのにかかる時間は、慣れてくると1〜2時間程度です。最初は慣れるまで半日かかることもあります。

ステップ①:台本を作る
なぜ台本が最初なのか
動画のアイデアがあっても、台本がないと画像も動画も作れません。どのシーンに何の画像が必要か、キャラクターが何を言うかが決まってはじめて、次のステップに進めます。
ChatGPTへの依頼のしかた
わたしの場合、ChatGPTに以下のような指示を出しています。
【ChatGPTへの指示例】 YouTube Shorts(60秒以内)用の台本を作ってください。 キャラクター:エリンギちゃん(きのこのキャラクター・のんびり屋) シチュエーション:コンビニでアルバイト中に〇〇が起きる トーン:ほのぼの・くすっと笑える 構成:①つかみ(0〜5秒)②本編(5〜50秒)③オチ(50〜60秒) カット割りも一緒に書いてください。
このように「キャラクター・状況・トーン・構成」を一緒に伝えると、そのまま使える台本が出てきます。
台本に含めると便利な情報
台本には本文だけでなく、以下も一緒にChatGPTに書いてもらいます。
- カット番号(カット1、カット2…)
- 各カットの場面説明(どんな画が必要か)
- キャラクターのセリフまたはナレーション
- 動き・表情の指定
このカット割りがあると、次の画像生成がスムーズになります。
ステップ②:キャラクターと画像を作る
キャラクターを「固定」するのが最大のコツ
AI動画でいちばん難しいのは、毎回同じキャラクターを生成することです。何も工夫しないと、生成するたびに見た目が変わってしまいます。
わたしが解決した方法は「キャラクター設定書(固定プロンプト)」を作ることです。
エリンギちゃんの場合、画像生成のたびに以下のフレーズを必ずプロンプトに入れています。
a cute small mushroom character with a large round warm-brown mushroom cap, cream-colored soft plush body, round black dot eyes, pink blush cheeks, no nose, small round mouth, stubby arms, 3D render, felt toy aesthetic, soft lighting, warm and cozy atmosphere
この固定フレーズに、シーンごとの指定(「カフェに座っている」「驚いた顔をしている」など)を追加することで、見た目を統一しています。

使うツールはどれがいいか
キャラクターの一貫性という点では、同じセッション内でChatGPT(DALL-E)を使い続けるのがいまのところいちばん安定しています。Geminiも品質は高いですが、セッションをまたぐと別キャラになりやすいです。
1本の動画に必要な画像の枚数
YouTube Shorts(20秒)の場合、カット数によりますが5枚程度の画像を用意します。Veo3は静止画から動画を生成するため、カットごとに1枚ずつ画像が必要です。
ステップ③:Veo3で動画を生成する
Veo3とは
Veo3はGoogleが提供するAI動画生成ツールです。静止画と指示文(プロンプト)を入力すると、数分で動画クリップを生成してくれます。
2025年時点では、自然な動きの質という点でVeo3が最も優秀だと感じています。
Veo3へのプロンプトの書き方
Veo3には英語でプロンプトを入力します。ポイントは「どんなキャラクターが・どこで・どんな動きをしているか」を具体的に書くことです。
【Veo3プロンプト例】 A small adorable mushroom character named Eringi-chan. She has a large round warm-brown mushroom cap on a cream-colored soft plush body. Round black dot eyes, pink blush cheeks, no nose, tiny round mouth. Very short stubby arms. She is standing behind a convenience store counter, looking slightly confused at a product in her hand. The store is warmly lit. Slow, gentle movement. 3D animation style.
注意点として、Veo3の実行はわたしが手動でやっています。生成には数分かかるため、プロンプトを送ってから待つ時間が発生します。一度に複数のカットを生成しておくのが効率的です。

うまくいかないときの対処法
- キャラクターの見た目がブレる→固定フレーズを増やす・より詳しく書く
- 動きが不自然→「slow and gentle movement」など動きの質感を指定する
- 背景が想定と違う→背景の描写も具体的に書く(色・照明・アイテムなど)
ステップ④:編集して投稿する
編集でやっていること
Veo3で生成した動画クリップをつなげて1本のショート動画にします。編集アプリはCapCutを使っています(無料で使えます)。
編集でやっていることはシンプルです。
- クリップをカット順に並べる
- テロップ(字幕)を入れる
- BGMをつける
- 冒頭3秒に「つかみ」になるテキストを入れる
YouTube Shortsに投稿するときのポイント
- タイトルにキーワードを入れる:「〇〇あるある」「〇〇の日常」など
- サムネイルはキャラクターの顔が大きく映るものを選ぶ
- ハッシュタグは3〜5個:#Shorts を必ず入れる
- 投稿時間:夜20〜22時が伸びやすい傾向
まとめ:AI動画制作の4ステップ

AIでYouTubeショート動画を作る全工程を整理すると、次のとおりです。
- 台本を作る:ChatGPTにキャラクター・状況・構成を渡して台本とカット割りを作る
- 画像を作る:固定プロンプト+シーン指定で画像生成AIからカットごとの画像を出力する
- 動画を生成する:Veo3に画像とプロンプトを入力して動画クリップを生成する
- 編集・投稿する:CapCutでクリップをつなぎ、テロップ・BGMを入れてYouTubeに投稿する
最初は慣れるまで時間がかかりますが、工程が決まってくると驚くほどスムーズになります。
各ステップの詳しい解説は個別の記事で書いていきます。気になるものがあればそちらもどうぞ。
