動画生成AI「Sora」 「動画があれば真実」は過去のものに

人民網日本語版 2024年02月23日11:20

短いテキストを入力すれば、すぐに非常に効果の優れた60秒の動画が完成する。米オープンAI社がこのたび打ち出した動画生成AI(人工知能)モデル「Sora」に世界が驚愕している。

オープンAIはチャットGPTを発表してからわずか1年余りで、再び重量級の新モデルを打ち出した。テキストだけで動画を生成するこのAIモデル「Sora」の素晴らしい点は何か。業界にもたらす影響とは。潜在的なリスクは何か。

オープンAIの公式サイトのスクリーンショット。

オープンAIの公式サイトのスクリーンショット。

「Sora」には何ができる?

「Sora」が生成した複数のショート動画の「大作」が、インターネットで次々に再生されている。動画内のシーンはリアルかつ自然で、細かい部分までよく作り込まれている。

オープンAIがAI動画生成の分野に進出したのは今回が初めてだ。同社によると、「Sora」は深層学習モデル「トランスフォーマーアーキテクチャ」を使用し、テキストの指示に従ってリアルで想像力に富んだシーンを作り出し、様々なスタイル、画幅で、最長1分間の高精細動画を生成してくれる。

同社は、現時点で「Sora」が生成した動画には、論理的におかしな画像や、左右が逆といった空間の細部の混同、複雑なシーンの物理的原理や因果関係の実例を正確にシミュレーションできない状況が起きる可能性があることを認めている。たとえば、人がビスケットを食べているのに、ビスケットに歯型が付いていない動画が生成されてしまうといったケースだ。ただ、計算力が増強され、モデルの改良が進めば、短期間でより優れた先進的な動画生成機能を手に入れることができるとしている。

仕事を奪われるのは誰か?

一部のアナリストは、「『Sora』はAI技術の進歩が現実の世界と従来型業界に大きな影響を与えることを改めて浮き彫りにした。AIの動画生成分野における極めて大きな発展の可能性は、映画・テレビ産業の新業態の創出に向けて大きく扉を開くと同時に、既存の映画・テレビ産業を破壊するおそれもある」との見方を示す。

「Sora」が生成した動画のスクリーンショット。

「Sora」が生成した動画のスクリーンショット。

「Sora」の発表翌日、画像処理や動画制作ソフトを主に手がけるアドビ社の株価はそれに応じて7%以上下落した。

ハリウッドでは昨年、63年ぶりとなる脚本家と俳優によるストライキが行われた。同業界の仕事の一部がAIによって奪われるのではないかとの懸念がストの原因だった。「Sora」の登場で脅威はより差し迫った、現実的なものになっている。

「動画があれば真実」は過去のものに

「Sora」の発表は、フェイク情報やフェイクニュースがアップグレードし続けていることも意味する。ショート動画プラットフォームから情報を得ることに慣れたネットユーザーは、これからは動画を気軽に信じられなくなる。

英国のブレッチリー・パークで、第1回AIセーフティサミットの宣伝パネルの前を通り過ぎる人(2023年11月2日撮影・李穎)。

英国のブレッチリー・パークで、第1回AIセーフティサミットの宣伝パネルの前を通り過ぎる人(2023年11月2日撮影・李穎)。

現在のところ、映画・テレビなど娯楽コンテンツ制作分野における「Sora」の応用に多くの人が注目しているが、実際には、「Sora」はニュースの制作方法とプロセスを変えることもできる。今や、技術を利用してねつ造されるフェイクニュースが次から次へと現れ、人々のニュースに対する従来の観念を変えてしまった。画像とテキストの時代には、「画像があれば真実」と考えられていたが、実は画像も加工可能だった。動画の時代には、多くの人が「動画があれば真実」と思っていたが、内容をすり替えるなどねつ造の手段が登場した。そして今、「Sora」が登場し、AIで動画を直接生成することができるようになり、オリジナルの素材さえ不要になった。

この動きを受けて、中央民族大学新聞・伝播学院の郭全中教授は、「『Sora』の登場で動画作成のハードルが大きく下がり、報道倫理が大きな打撃を被ることになるだろう」との懸念を示す。

上海合合情報科技股份有限公司の郭豊俊・画像アルゴリズム研究開発総監も、「AI技術の発展にともなって、ディープフェイクがもたらすガバナンスの危機がより顕在化するだろう」と指摘する。

「魔法で魔法を打ち負かす」

それではディープフェイクをより正確に見分けるにはどんな方法があるだろうか。多くの業界関係者が、「AIによってAIを見分ける」ことを「魔法で魔法を打ち負かす」と例え、技術的手段を通じてディープフェイクを根本的なところで識別し、関連のリスクを低下させるチャンスはあるとの見方を示す。

オープンAIによると、現在、関連の研究を進めており、これには誤った内容を含んだテキストや画像を識別する装置が含まれる。オープンAIの製品のうち、このテキスト識別装置は法律に違反したテキスト入力をチェック・拒否するもので、極端な暴力、性的な内容、ヘイト、有名人の画像、他人のIPなどが対象で、注意も喚起する。当社は有力な画像識別装置も開発しており、生成された動画のフレームを全てチェックして、ユーザーが見る前に、動画が当社の利用方針に合致するものになるように保証しているという。

前出の郭氏は、「中国内外の多くの企業がAIによる改ざんの識別に注目しており、その中には、中国電信(チャイナ・テレコム)などの中央企業(中央政府直属の国有企業)、瑞莱智慧(RealAI)、中科睿鑑科技などの大学・短大・高専と科学研究機関がインキュベートしたテクノロジー企業、網易や合合などの長年にわたりAI業界に深く関わってきたテクノロジー企業といった多くの中国企業が含まれる。全体的に言えば、中国の科学研究チームがディープフェイクの識別で上げた成果は世界トップレベルにあり、複数の国内の研究チームが世界的に有名なねつ造を見抜く技術を競うコンテストで優れた成績を収めている」と説明する。

しかし業界関係者は、「『魔法で魔法を打ち負かす』のはやはり責任の重い遠い道のりだ。ディープランニングやコンピュータビジョンなどの分野の技術のたゆまぬ進歩につれ、ねつ造識別技術も絶えず高度化して応用シーンを広げなくてはならない。この過程では、より多くの企業やSNSプラットフォームが参加し、『社会的利益のための技術』になるよう共に努力することが必要だ」と指摘する。(編集KS)

「人民網日本語版」2024年2月23日

注目フォトニュース

関連記事