【本記事はアフィリエイト広告を含みます。】

AI技術

【革新発表!】OpenAIがテキストからビデオを生み出す最新AI「Sora」を発表!

OpenAIが打ち出した「Sora」、テキストからビデオを生み出す未来技術がここに!

OpenAIがまたしてもAI技術に衝撃的なニュース!「ChatGPT」を生み出したチームから、今度はテキストを使ってビデオを生成する力を持つ最新の拡散モデル「Sora」が登場。さまざまな解像度やアスペクト比でのビデオ生成はもちろん、既存のビデオを編集し、風景、照明、撮影スタイルをテキストプロンプトから一変させる能力を持っています。Soraは静止画からビデオを生成したり、欠けているフレームを埋めて既存のビデオを拡張することも可能です。

ハイライト

  • OpenAIがテキストからビデオを生成する新AI「Sora」を発表、様々な解像度でビデオ生成と既存ビデオの編集が可能。
  • 「Sora」は最大1分間のフルHDビデオコンテンツを生成し、そのサンプルは大きな期待を集めている。
  • 複数キャラクターや特定の動きを含む複雑なシーン生成が可能で、物理世界の理解も兼ね備える。
  • OpenAIは、安全プロトコルを適用し、専門家によるリスク評価テストを実施中
  • 公式発売日は未定だが、政策立案者、アーティスト、教育者との議論を通じて潜在的な懸念や使用例を探求予定。

AIによるビデオ作成とは?

OpenAIによると、Soraは現在、最大1分間のフルHDビデオコンテンツを生成可能で、そのサンプルビデオは大いに期待を集めています。Soraのランディングページでは、さらに多くの生成ビデオサンプルをチェックできます。

複雑なシーンや、複数のキャラクター、特定の動き、被写体や背景の正確なディテールを含むビデオを生成できるSora。このモデルは、ユーザーがプロンプトで求めたものだけでなく、それらが物理世界でどのように存在するかも理解しています。

Soraは、ChatGPTと同様のトランスフォーマーアーキテクチャを使用し、ビデオと画像を「パッチ」と呼ばれる小さなデータ単位として扱います。Soraによって生成されるビデオは、静的ノイズから始まり、モデルが徐々にノイズを取り除きながら最終製品を形成していきます。

Noisy input patches transformed to high quality video

OpenAIは、DALL·E 3で使用された既存の安全プロトコルをSoraにも適用しています。現在、Soraは「レッドチーム」によってテストされており、公式の発表前に潜在的なリスクを評価します。

ビデオの肖像権など今後に課題

また、OpenAIは政策立案者、アーティスト、教育者との話し合いを行い、Soraに関する潜在的な懸念や使用例を探る予定です。公式の発売日はまだ提供されていませんが、技術の未来を切り開くこの画期的な発表に、世界中から注目が集まっています。

Source:1

-AI技術