AIでショート動画を1人で作る方法【台本→キャラ→動画の全工程を公開】

「AI動画って自分でも作れるの？」と思ったことはありませんか。

わたし（エリンギ）は、AIを使ってショートアニメ動画を1人で作っています。キャラクターのデザイン、台本、動画生成、すべてAIツールを組み合わせて完結させています。

この記事では、台本を作るところから動画を投稿するまでの全工程を、実際に使っているツールとともに公開します。

特別なスキルは必要ありません。わたし自身、動画制作の経験はゼロからスタートしました。

この記事でわかること
使っているツール一覧
全工程の流れ（4ステップ）
ステップ①：台本を作る
ステップ②：キャラクターと画像を作る
ステップ③：Veo3で動画を生成する
ステップ④：編集して投稿する
1. 編集でやっていること
2. YouTube Shortsに投稿するときのポイント
まとめ：AI動画制作の4ステップ

この記事でわかること

AI動画を1人で作る4つのステップ
実際に使っているツールと役割
台本・キャラクター・動画それぞれの作り方のコツ
初心者がつまずきやすいポイントと対策

使っているツール一覧

まず全体像として、使っているツールをまとめます。

工程	使うツール	費用目安
台本作成	ChatGPT	無料〜月額$20
キャラクター画像生成	ChatGPT（DALL-E）/ Gemini	無料〜月額$20
動画生成	Veo3（Google）、Frow	従量課金
動画編集・投稿	CapCut / スマホ標準アプリ	無料〜

すべてスマホだけでも動かせますが、画像生成やVeo3はパソコンのほうが操作しやすいです。

全工程の流れ（4ステップ）

大きな流れはこのとおりです。

台本を作る（ChatGPTやGeminiで）
キャラクターと背景の画像を作る（画像生成AIで）
動画を生成する（Veo3で）
編集して投稿する

1本の動画を作るのにかかる時間は、慣れてくると1〜2時間程度です。最初は慣れるまで半日かかることもあります。

ステップ①：台本を作る

なぜ台本が最初なのか

動画のアイデアがあっても、台本がないと画像も動画も作れません。どのシーンに何の画像が必要か、キャラクターが何を言うかが決まってはじめて、次のステップに進めます。

ChatGPTへの依頼のしかた

わたしの場合、ChatGPTに以下のような指示を出しています。

【ChatGPTへの指示例】

YouTube Shorts（60秒以内）用の台本を作ってください。

キャラクター：エリンギちゃん（きのこのキャラクター・のんびり屋）
シチュエーション：コンビニでアルバイト中に〇〇が起きる
トーン：ほのぼの・くすっと笑える
構成：①つかみ（0〜5秒）②本編（5〜50秒）③オチ（50〜60秒）

カット割りも一緒に書いてください。

このように「キャラクター・状況・トーン・構成」を一緒に伝えると、そのまま使える台本が出てきます。

台本に含めると便利な情報

台本には本文だけでなく、以下も一緒にChatGPTに書いてもらいます。

カット番号（カット1、カット2…）
各カットの場面説明（どんな画が必要か）
キャラクターのセリフまたはナレーション
動き・表情の指定

このカット割りがあると、次の画像生成がスムーズになります。

ステップ②：キャラクターと画像を作る

キャラクターを「固定」するのが最大のコツ

AI動画でいちばん難しいのは、毎回同じキャラクターを生成することです。何も工夫しないと、生成するたびに見た目が変わってしまいます。

わたしが解決した方法は「キャラクター設定書（固定プロンプト）」を作ることです。

エリンギちゃんの場合、画像生成のたびに以下のフレーズを必ずプロンプトに入れています。

a cute small mushroom character with a large round warm-brown mushroom cap,
cream-colored soft plush body, round black dot eyes, pink blush cheeks,
no nose, small round mouth, stubby arms, 3D render, felt toy aesthetic,
soft lighting, warm and cozy atmosphere

この固定フレーズに、シーンごとの指定（「カフェに座っている」「驚いた顔をしている」など）を追加することで、見た目を統一しています。

使うツールはどれがいいか

キャラクターの一貫性という点では、同じセッション内でChatGPT（DALL-E）を使い続けるのがいまのところいちばん安定しています。Geminiも品質は高いですが、セッションをまたぐと別キャラになりやすいです。

1本の動画に必要な画像の枚数

YouTube Shorts（20秒）の場合、カット数によりますが5枚程度の画像を用意します。Veo3は静止画から動画を生成するため、カットごとに1枚ずつ画像が必要です。

ステップ③：Veo3で動画を生成する

Veo3とは

Veo3はGoogleが提供するAI動画生成ツールです。静止画と指示文（プロンプト）を入力すると、数分で動画クリップを生成してくれます。

2025年時点では、自然な動きの質という点でVeo3が最も優秀だと感じています。

Veo3へのプロンプトの書き方

Veo3には英語でプロンプトを入力します。ポイントは「どんなキャラクターが・どこで・どんな動きをしているか」を具体的に書くことです。

【Veo3プロンプト例】

A small adorable mushroom character named Eringi-chan.
She has a large round warm-brown mushroom cap on a cream-colored soft plush body.
Round black dot eyes, pink blush cheeks, no nose, tiny round mouth.
Very short stubby arms.

She is standing behind a convenience store counter,
looking slightly confused at a product in her hand.
The store is warmly lit. Slow, gentle movement. 3D animation style.

注意点として、Veo3の実行はわたしが手動でやっています。生成には数分かかるため、プロンプトを送ってから待つ時間が発生します。一度に複数のカットを生成しておくのが効率的です。

うまくいかないときの対処法

キャラクターの見た目がブレる→固定フレーズを増やす・より詳しく書く
動きが不自然→「slow and gentle movement」など動きの質感を指定する
背景が想定と違う→背景の描写も具体的に書く（色・照明・アイテムなど）

ステップ④：編集して投稿する

編集でやっていること

Veo3で生成した動画クリップをつなげて1本のショート動画にします。編集アプリはCapCutを使っています（無料で使えます）。

編集でやっていることはシンプルです。

クリップをカット順に並べる
テロップ（字幕）を入れる
BGMをつける
冒頭3秒に「つかみ」になるテキストを入れる

YouTube Shortsに投稿するときのポイント

タイトルにキーワードを入れる：「〇〇あるある」「〇〇の日常」など
サムネイルはキャラクターの顔が大きく映るものを選ぶ
ハッシュタグは3〜5個：#Shorts を必ず入れる
投稿時間：夜20〜22時が伸びやすい傾向

まとめ：AI動画制作の4ステップ

AIでYouTubeショート動画を作る全工程を整理すると、次のとおりです。

台本を作る：ChatGPTにキャラクター・状況・構成を渡して台本とカット割りを作る
画像を作る：固定プロンプト＋シーン指定で画像生成AIからカットごとの画像を出力する
動画を生成する：Veo3に画像とプロンプトを入力して動画クリップを生成する
編集・投稿する：CapCutでクリップをつなぎ、テロップ・BGMを入れてYouTubeに投稿する

最初は慣れるまで時間がかかりますが、工程が決まってくると驚くほどスムーズになります。

各ステップの詳しい解説は個別の記事で書いていきます。気になるものがあればそちらもどうぞ。