昨今、大規模な学習データを用いて、品質の高い様々なコンテンツ生成を可能にするサービスが一般的に利用できるようになり、AIを活用したコンテンツ制作を始めるユーザーが増えています。
AIによるコンテンツの生成は、それぞれのサービスが持っている特徴を活用すれば、様々な新規ビジネスを得て利用することができます。
本記事では、AIによるコンテンツ生成ができるサービスを紹介しつつ、新しいアプリケーションが出てきた時には随時、情報を追加していき解説していきます。
AI生成コンテンツとは?
AI生成コンテンツとは、Artificial Intelligence(人工知能)と呼ぶことができる仕組みを指します。
生成出来るコンテンツは、その組み合わせをあげればキリがないのですが、大別して4種類に分けることが出来ます。
- テキスト(文字や文章)
- 画像(イラストや写真)
- 動画
- 音(音楽や音声)
上記の4つが組み合わさって様々なコンテンツが生まれます。
また、その使い方によって、例えばテキストであれば
- キャッチコピーなどのメッセージ性の強い短文
- 物語の下地になる文章生成
- Webサイトのテキストコンテンツやブログ記事の仮文章
上記のようなコンテンツを、AIに伝える事で解答が返ってきます。
有名どころで言えば、2022年に登場したChatGTPという、様々な問いに対して質問をするとAIが解答してくれるコミュニケーションツールです。
OpenAIが提供している機能のうちの1つで、文章の入力をするだけで、ブログラムやコーディング、アプリ開発に必要なモジュールの開発までを担ってくれるという衝撃は、あっという間に利用者を増やすことになりました。
それ以外にも、DALL-Eという画像生成AIについても、一般ユーザーが利用できるように公開され、プロンプト(アウトプットしたい画像の特徴)を文章形式、或いは単語単位で区切りを入れて、テキストを入力するフォームに入れるだけで、AIが画像を生成してくれるという機能も公開されています。
AI生成コンテンツを活用した事例
AI生成コンテンツを活用した事例は、日々、次々とアイデアが公開されて話題になっています。
その内の1つで、大きな市場が生まれる可能性を持っている中にAI VTuberがあります。
OBSなどのライブ配信用アプリと他のアプリケーションを組み合わせて、YouTubeでライブ配信しながら、言語モデルにカスタマイズした教師データを加えて、AI VTuberが視聴者とコミュニケーションをして会話をしたりする内容です。
視聴者からもらった質問テキストを読み込み、ChatGTPなどで利用されている、言語モデルで処理をして内部的にテキストを出力します。
その出力したテキストを、AI VTuberが読み上げて、視聴者とコミュニケーションをとるというモノです。
やりとりされる会話の制御を上手くやれば、放っておいてもライブ配信を自動的に続けることが出来るくらい、コミュニケーションの精度は上がっています。
この他、本記事の後半で、アーカイブで筆者が100本ほど動画を作ったときに活用した事例も紹介します。
AI生成コンテンツはクリエイターにとって悪影響なのか?
AI生成コンテンツの利用については、生成されるコンテンツの種類によって賛否両論、特に、学習元データやAIが生成したコンテンツの著作権について活発に議論が行われています。
筆者の場合、検索エンジンからの流入によるWebメディアの運営をしているので、とくにGoogle検索への影響や、コンテンツ(この場合は文章)がどのように考えられるのか、とても興味深く観察しています。
検索エンジンサービスのGoogleからはGoogleのAI生成コンテンツに対するガイダンスについて公式な見解が出てきており、AI生成コンテンツを補助ツールとして、ユーザーの役に立つコンテンツが作れるのか?が今後の焦点となってきます。
AI生成コンテンツには現状、基本的に体験や経験というコンテンツを書く事が難しい状況(カスタマイズで自分の経験を教師データにすることは出来る。)なので、この部分についてどのように自分自身の体験や経験を織り交ぜてテキストコンテンツを繋いでいけるのか、多くの人が検証を行っています。
これは、テキスト以外の、イラストや画像などのデザイン物、音楽や音声などについても同様です。
現状は、決定的な動画の生成サービスが出てきていないのですが、今後、このあたりも技術公開がされて一般ユーザーが体験できるようになり、サービスとして提供されるようになってくると、また色々な課題が出てくるところだとも考えています。
実際にGoogle社は、Imagen Videoという、すでにAIによる動画生成技術はあるが、まだ公開するには課題が多いということで、技術的には出来ているものの、一般公開はしないという公式発表をしています。
しかしながら、このほか、現在ではGen-2 in Runwayという、テキストからも画像からも、そして画像にテキストで情報を付加して動画を作成することも可能なWebサービスなどが生まれています。
AIで生成したコンテンツ制作の始め方や使い方
AIによるコンテンツ生成を体験することはとても簡単です。
AI生成コンテンツを体験したり、利用するサービスは数多くあるのですが、本記事では、取り急ぎOpenAIや、商用で使えるAI音声合成技術を中心に解説していきます。
再度の掲載になりますが、コンテンツの種類は基本的に4種類です。
- テキスト(文字や文章)
- 画像(イラストや写真)
- 動画
- 音(音楽や音声)
1.テキストによるAI生成コンテンツの体験
テキストコンテンツによる、AI生成コンテンツの体験をするには、現状はChatGTPが非常に有効と考えています。
この他にも、OpenAI APIを活用するためのPlaygroundで、ChatGPTよりも多くの文章生成を体験するフォームもあります。
2.画像(イラストや写真)をAIでコンテンツ生成する
AIが生成する画像コンテンツを体験したい場合は、画像やイラストを日本語で簡単に出力できるDALL・Eなどが向いています。
少しだけですが、無料で利用することが出来るように配慮してくれているので、すぐにAIによる画像生成体験をすることが可能です。
最近は、DALL・Eの画像生成モデルを開発したOpan AIの技術で、Bing Image Creatorでも画像生成が出来るようになったので、マイクロソフトのアカウントを持っている人は体験が可能なので、是非、試してみてください。
上記のプラットフォーム以外にも、よりイラストに特化したサービスや写真画像向けに特化したサービスなどがあるので、好みに応じて色々体験してみることが可能です。
Adobe Fireflyなどは、Adobeが管理している学習データの範囲で体験が可能です。
Adobe Fireflyが2023年9月13日に一般提供開始を始める
そして、生成AI画像に関して、しばらくの間β版として提供されていたAdobe Fireflyが、2023年9月13日に一般提供開始[1]となりました。
商用利用も可能とされていて、生成されるデータの透明性についても仕組み構築が日々進んでいます。
例えば、AI生成画像を解析するWebサービスとして『verify』等がありますが、ここでチェックも可能です。
また、Adobe Firefly で生成された素材のコンテンツ認証情報についても公開されているので参考になれば幸いです。
生成AI分野は、学習データに利用された作品への還元方法について多くの議論がありますが、そもそも学習データに利用されたくない場合はどうすれば良いのかについても数多くのコミュニティーで議論されています。
クリエイターとして活用して行く方向性としては、イラストやデザインが出来る人は、自分のデザイン物を学習データ(教師データ)でローカル環境で読み込ませ、自身のタッチを学習したAIが効率的にコンテンツを生成なども可能です。
また、様々なポーズを描いてきたデータをストック画像サービスに登録していけば、新しい収益機会を増やしていく事も可能になる時代がすぐそこまで来ているのが確かな状況になっています。
加えて、上手くプロンプト扱えれば、今後はVTuberのモデルデータで使う感情パラメーター類に適応させた。細かい表情パーツについても効率的に制作していくことが可能になります。
とはいえ、やはり著作権の問題は、特に国をまたぐと非常にややこしいというのも正直なところですし、各クリエイターやアーティストの意向が尊重されなければいけません。
あくまでも一例ですが、例えば、Webブラウザ上や画像生成の環境を繋ぐことで利用可能になる画像生成AIで人気のモノなどは、学習元データの解析ができたり、情報を開示するページも提供していて、著作権者が調査をすることで、その学習データセットから自分の写真やイラスト、デザインデータを削除することも可能になっています。
SNSなどで人気が出てきて、最初はそのアカウントの成長具合に喜べるかもしれないのですが、解析すれば分かってしまうことも多くありますので、乱用するのは避けましょう。
AI生成コンテンツは今後、AIコンテンツの場合の明記が必要になったり、生成AI系コンテンツのサービス提供者は、学習元のコンテンツ開示や、著作者のデータを学習データとして利用しないようにするなど環境の整備などがされていく方向性になっていくと考えていましたが、本記事をリライトしている間に、どんどん自由と規制についての議論が進んでいます。
行く先を少しずつでも、このブログ記事に残していければ幸いです。
3.AI生成コンテンツで動画を作成する
すでに、出来上がった映像コンテンツを、AIの解析技術によって編集するサービスなどはありますが、ゼロから動画を生成するコンテンツは、まだ決定的なものが出てきていないというのが現状です。
短い時間の動画コンテンツを生成しているプレスリリースなどを見かけますが、特にアニメーションなどの場合は、アニメーションなどには欠かせない中割を作ることが難しいと思われるため、現状は少し不自然なストップモーションのような動画が生成されている状況と判断しています。
参考リンク:Imagen Video
そんな中でも利用用途は慎重に考える必要がありますが、Gen-2 in Runwayという、画像やテキスト、または画像にテキストを付加して動画を生成する生成コンテンツWebサービスなどが出てきています。
技術を組み合わせてコンテンツを生成することは可能になっている
ただ、筆者の場合、ショーと動画が流行っている中、このような技術と色々組み合わせることで付加価値の高い動画を制作する市場が生まれると考えています。
また、ゼロからでなければ、画像認識技術や音声認識技術などを活用したコンテンツがすでに生まれていて、筆者も100本ほど動画をYouTube上にアップしています。
参考リンク:猫のきもち|YouTubeショート動画 – 完
今後はAIVtuberがドンドン増えてくる
改めて、別記事で始め方や使い方を紹介する予定ですが、上記のようなYouTubeコンテンツ以外以外にも、今後はAI VTuberが一気に増えてくると考えています。
すでに、。AIによるテキストから音声変換へのコンテンツ生成と、3Dモデルも含めた画像やデザイン物の生成が可能になっているので、所定の機材やアプリケーションを揃えることでAI VTuberを実現することはそれほど難しくありません。
※但し、ライブ配信などでAIVTuberを完璧に自走させるのは難し部分もあるので、最初は自分かモデレーターの方と一緒に運用するほうが安全です。
4.AIが生成したBGMや音声コンテンツを活用する
BGMや音声コンテンツは、かなり前からAI生成コンテンツが利用されているので、あまり新しいことは多く書けないのですが、明らかに以前と変わっているところもあります。
- 商用利用がしやすくなった(利用用途の幅)
- 抑揚などの読み上げ品質を高めやすくなった(ソフト品質の向上)
- アプリケーションの価格が手頃になり、別途必要になる機材が必要ないモノが多くなった
と言うところです。
筆者が会社時代だった数年前から10年くらい前は、このあたりで技術的にも予算的にも障壁が高くて、検証をしたり実験をするのに多くの費用やインターフェイスが必要で苦労したのをよく覚えています。
最近、検証でよく利用しているものとして3つあります。
上記は、いずれも商用利用するときのライセンス条件が分かり易いサービスラインナップなので紹介していますが、個人的に検証で利用する範囲であれば、より多くのAI生成BGMサービスがたくさんあるので、色々体験してみる価値ありです。
AIで生成したコンテンツの制作で新しい事業機会を得る
AI生成コンテンツは日々進化していて、本文中にも書いたように、良質な動画コンテンツのAI生成まで可能になると、多くの新しい事業機会が生まれます。
特に、イラストやデザインが出来る人にとっては、新しいビジネスに繋げるためのチャンスになる状況になります。
関連記事:イラストやデザインの副業で収入を上げて独立できるくらいの生活を可能にする方法を解説
また、少しでもエンジニアリングの経験があって、スクリプト言語などにふれた経験があれば、先ほど紹介したAI VTuberの仕組みを組んで運用することも難しくありません。
そして、動画生成AIで背景などのワールド系コンテンツを生成すれば、配信する時の動画もかなり高品質なリッチコンテンツにすることが可能になります。
これ以外にも、多くの収益化出来る事業機会は数多くあり、筆者のように個人レベルの小さな会社でも実現可能な収益化モデルを多く作り出していくことが可能になります。
AI生成コンテンツについては、まだまだ色々な意見、賛否ありますが、上手く取り入れて補助ツールとして活用することが出来れば、たくさんのチャンスが生まれます。
そして、それらのコンテンツをWebメディアで結びつけていけば、自分のビジネスモデルに合わせた導線を気付くことも可能になります。
ぜひ、いろいろ体験しつつ準備を始めて見てください。
AIで生成したコンテンツ制作に関する脚注
- アドビ、Adobe Fireflyの一般提供開始と「Adobe Firefly web版」を発表|Adobe公式Webサイト ↩︎