Gen-3 Alphaの利用料
動画生成サービスを展開するRunwayは7月1日、6月17日に発表した次世代の動画生成モデル「Gen-3 Alpha」の一般提供を開始しました。利用には月額12米ドル(およそ2000円)からの有料プランに加入する必要があります。無料では使えません。
Gen-3 Alphaの特徴
Gen-3 Alphaは現行モデルと同様、プロンプトから動画を生成する“text to video”生成ツールです。画質、一貫性、動きの面で大幅な改善が実現されており、「General World Model(汎用世界モデル)」を構築するための一歩として位置づけられています。
提供開始後、日本でも多くのユーザーがX(旧Twitter)にGen-3 Alphaで制作した動画を投稿し、話題となっています。
機能と使用方法
生成できるビデオの解像度は720p(1280×768)のみで、長さは5秒と10秒(デフォルト)から選択できます。UIはシンプルで、モーションブラシやカメラコントロールはまだ実装されていません。
実際に試したユーザーの投稿によると、生成されるビデオの品質は良好であり、手や表情の細部まで精細に表現されています。ただし、Image to Videoの機能がまだないため、Text to Videoのみでの生成となります。
実際の使用例
- プロンプト例1:
- 「緊迫した表情で歩いている若い女性」
- 生成された動画:
- 未来都市の荒廃した道路を緊迫した表情で走る若い女性。背後には爆発の煙が上がっている。
- プロンプト例2:
- 「手を合わせて祈る美しい女性」
- 生成された動画:
- 暗い背景の中、柔らかな光に照らされた女性の手が胸の前でゆっくりと合わさり、カメラがその動きを追う。
- プロンプト例3:
- 「ステージ上で熱唱するガールバンドのボーカリスト」
- 生成された動画:
- 夏のロックフェスティバルのステージ上で、汗をかきながら熱唱する短髪のアイドル歌手。
使用感とユーザーの声
ユーザーからは、生成されるビデオの品質について高評価が寄せられています。特に、手の表現やリップシンク機能の精度が向上しており、自然な動きが再現されています。しかし、以下のような改善点も指摘されています。
- 制御の難しさ: Text to Videoのみのため、細かな制御が難しく、意図した映像を生成するのが困難。
- コスト: クレジット消費型のため、頻繁に使用するユーザーにはコストがかかる。無制限プランは高額。
作品例
「ラーメンを食べるパンダ」
生成された動画の品質は良好で、パンダの動きやラーメンの質感がしっかりと表現されている。
「未来都市を歩く女性」
背景のディテールや女性の動きがリアルに再現され、爆発の煙も自然に描かれている。
「祈る女性の手」
手の動きや光の表現が非常にリアルで、カメラの動きも滑らか。
「ロックフェスティバルのボーカリスト」
ライブパフォーマンスの臨場感が伝わる映像が生成され、汗の表現もリアル。
期待できる
Gen-3 Alphaの動画生成は、従来のモデルと比較しても非常に高品質で、特にリップシンク機能の精度が向上しています。しかし、Text to Videoの制御が難しいため、意図した映像を生成することが困難な場合もあります。今後、Image to Videoの機能やモーションブラシ、カメラコントロールの実装が期待されます。
価格に関しては、月額12米ドルから利用可能ですが、クレジット消費型のため、頻繁に使用するユーザーにはコストがかかる点が課題です。プロユーザー向けの無制限プランも提供されていますが、月額95米ドル(約1万4000円)と高額です。
まとめ
Gen-3 Alphaは、動画生成AIの技術進化を象徴する革新的なツールであり、SNSなどでのコンテンツ制作には大いに役立つでしょう。ただし、商業利用や本格的なクリエイティブワークには、今後の機能追加と改善が必要とされます。
興味のある方は、まずはスタンダードプランで試してみることをおすすめします。詳細については、Runwayの公式サイトや関連動画をチェックしてください。