生成AI

最終更新日:2025/02/27
Meta社は、2024年10月に独自の動画生成AI「Movie Gen」を発表しました。テキストだけでなく、画像からの動画生成や音楽の追加など動画制作に役立つ多彩な機能を搭載しています。同ツールで生成された10秒間の動画クリップも同時に公開され、最先端AIツールとして注目が集まっています。
本記事では、Movie Genの概要や主な機能をはじめ、他の動画生成AIサービスとの違いや使い方などについて解説します。倫理や創作に関する注意点なども紹介しますので、革新的なAIツールについて理解を深め、クリエイティブな表現の幅を広げるためにぜひご覧ください。
「Movie Gen」は、Meta社が開発した最先端の動画生成AIモデルです。動画はもちろん、画像や音声、テキストを扱えるマルチモーダルAIとして設計されており、テキスト入力により最大16秒(16フレーム/秒)の高解像度の動画を生成できます。また、BGMや効果音をつけることや、既存動画の編集も可能です。
従来、動画制作には高価な機材や専門技術、そして膨大な時間と手間がかかっていました。しかし、Movie Genの登場により、簡単なテキスト入力で、誰でもプロレベルの高品質な動画を効率的に生成できます。
Movie Genは、画像生成AI「Make-a-Scene」や「Llama Image」といった基盤モデルからの進化により誕生しました。過去に開発されたAI技術の集大成として、さらに高度で柔軟な制御が可能になっています。
関連記事:Meta、高解像度動画生成モデル「Movie Gen」を発表。最大16秒の音声付き動画の生成が可能に
ここでは、Movie Genで特筆すべき特徴として、以下の4つを解説します。
Movie Genは、テキストだけでなく、画像や音声、動画など複数のデータを形式を用いて動画を生成できるマルチモーダルAIです。テキストのプロンプトを入力することで、最長16秒(16フレーム/秒)の高品質な動画を生成します。
今までにも、単純に静止画を動かすことで、動画として出力できるシステムはありましたが、Movie Genでは物の動きや被写体と物体の相互作用、カメラワークを理解し、さまざまな概念に対して妥当な動きを学習した上で、現実的な動きを再現できます。
Movie Genでは、登場人物を指定して動画を生成することも可能です。例えば、特定の人物画像とテキストプロンプトを組み合わせることで、視覚的な詳細情報を盛り込んだパーソナライズ動画を生成できます。
個人の写真とテキストプロンプトを組み合わせて、人物の特徴や動きを豊かな視覚的詳細を含んで生成します。
既存動画の編集も可能です。テキストと動画の両方を入力することで、動画の部分的な置き換えや要素の追加・削除、背景の変更なども行えます。
これまでの動画編集ソフトでは、専門的な知識やスキルを要する作業も少なくありませんでしたが、Movie Genを使うことで簡単かつ効率的に動画を編集できます。クリエイターの表現の幅が広がり、品質の向上にも貢献します。
Movie Genでは、音声やBGMなどの音を扱える点も特徴です。テキストプロンプトから最大45秒間の音声を生成できます。例えば、効果音や環境音、インストゥルメンタルなどの種類に対応しています。
また、既存の動画に合わせて、BGMや効果音、音声を追加・調整でき、動画の映像と音声を全てテキスト入力で完成させることが可能です。
Movie Genでは、300億ものパラメータを持つTransformerモデルを採用しており、高度な文脈理解と豊かな表現力を実現しています。また、音声生成には別の130億パラメータモデルを用いています。
AIの学習には、約1億本の動画と10億枚の画像、そして約100万時間の音声データを使用しています。ライセンス取得済みのデータセットに加え、一般公開されているデータセットを組み合わせることで、品質の高さを維持しつつ最大16秒の動画生成を成功させました。
また、開発には、アーキテクチャの改良や学習目標の設定、評価プロトコルの確立といった複数の技術が採用されています。その結果、出力される動画や音声の精度や多様性における大幅な向上に成功しました。
さらに性能評価では、人間による主観評価を重視しており、実際のユーザー体験を基にした改良が実現可能です。
Movie Genと同じように、動画を生成できるAIツールには、Runway社の「Gen3」やOpenAI社の「Sora」、Luma Labs社の「Dream Machine」、Kuaishou社の「Kling」など多数あります。Meta社が公開している性能評価データによれば、Movie Genは動画生成や音声生成、動画編集といった機能において、他のAIツールより高いパフォーマンスを打ち出しています。
特に、Movie Genは物理法則を理解し、歪みの少ない一貫した動きを盛り込むことで、より現実的な動画を完成させられる点が評価されています。
Movie Genは、アメリカなど一部の国や地域にて一般公開が始まったばかりのため、日本からは利用することができません。ただ、一般的に広く浸透することで、映画や広告、ソーシャルメディアなどクリエイティブ産業に大きな変革をもたらすと考えられます。
Movie Genの主な活用シーンとしては、以下のようなものが挙げられます。
Movie Genにより、専門的な知識や技術がない人でも本格的な動画を短時間で生成することが可能になります。一般ツールとして浸透すれば、表現の自由がさらに広がる可能性がある一方で、課題も残されています。ここでは、Movie Genの将来性や課題について解説します。
Meta社CEOのマーク・ザッカーバーグ氏は、Movie Genは驚異的な能力を持つ一方で、いくつかの制限も存在することを指摘しています。具体的には、以下のような点です。
リアルタイムでの動画出力や詳細な部分への作業については、今後改善されていくと予測されます。
AIによる動画生成においては、倫理面にも注意が必要です。特に、有名人をはじめ実在する人物の画像を使ったディープフェイク動画は、世界的な社会問題へと発展しています。動画生成AIは創作作業を促す一方で、虚構と真実の境目を明確に保つために対応する必要があります。
Meta社は、安全対策を講じた上で、Movie Genを公開する方針を明かしていませんが、技術の進化に応じた法整備や社会全体での対策の必要性も高まっています。ユーザー側としても、違法行為には注意してツールを活用する必要があります。
Movie Genの登場により、映画・メディア業界などクリエイティブ業界に影響が及ぶ可能性があります。動画制作のプロセスが大幅に変わることで、プロのクリエイターが作業の初期段階の工程やアイデアの可視化を効率化できます。
一方で、AIが人間の仕事を奪うのではないかという懸念も出ています。AIはあくまでもツールとして活用し、人間の創造性を重視しつつ、AIと人間との協調へと移行していく必要があります。
同時に、クリエイターやユーザーは技術よりも、アイデアやコンセプトの創造に注力し、AIリテラシーを身につけることも重要です。
Movie Genは、動画の制作や編集、音声の生成といった多彩な機能を持ち合わせたマルチモーダルAIです。専門的な技術や知識がなくても、高品質な動画や音声を作り上げることができます。
クリエイティブ業界に革命的な変化をもたらす可能性を秘めていますが、現時点では映像の長さなどの制限があります。また、倫理的な問題への対処やクリエイティブ業界への影響にも配慮が必要です。Movie Genをはじめとする動画生成AIを取り入れ、業務に活かすことをおすすめします。
アイスマイリーが独自に作成した「生成AIサービスの提供企業一覧」を、下記より無料で配布しています。自社の生成AIの活用にお役立てください。
現時点では、Movie Genはアメリカなど一部の国や地域のみで一般公開されており、日本のユーザーは直接利用することはできません。VPNなどを使用することで、アメリカのサーバー経由でMetaAIに試せる可能性はあります。
Movie Genの日本における具体的なリリース時期や詳細については言及されていません。ただ、Meta社CEOのマーク・ザッカーバーグ氏によれば、Movie Genは2025年にInstagram上で公開される可能性を示しています。
業務の課題解決に繋がる最新DX・情報をお届けいたします。
メールマガジンの配信をご希望の方は、下記フォームよりご登録ください。登録無料です。
AI製品・ソリューションの掲載を
希望される企業様はこちら