この記事ではオープンソースのStableDiffusionで実際に作った写真を紹介してみたいと思います。
ここ最近のAI画像生成がブームですが、優秀な人たちが熾烈な競争に参加していた印象です。日本語での情報が少なかった印象ですが、今はもうどのサイトもAI作品で溢れかえっている状況ですので、自分のノウハウの一部をここで無料で提供します。
AIとはそもそも何か
まず普通の一般的な人向けに少し書きます。AIというとヒト型のロボットが人間のように話すのを想像すると思いますが、最近よく話題になる「AI」というのは全然違います。
今開発されているAIは人の脳の動きによく似たプログラムが、特定の処理に限って人間よりも高い能力で処理が可能となった、という感じです。
例えば人間の目にあたる「画像認識」、耳にあたる「音声認識」などが得意となり、コンピュータへの高度な機能の実装を可能としています。
大量の画像のパターンを認識して、それに基づいてまるで現実の写真かのような描画が可能となったのが、この記事で紹介しているStableDiffusionというシステムです。
前提レベル
StableDiffusion自体はオープンソースですので、誰でも無料で使えます。ライセンスも特にありませんので作った画像は自由に自分のサイトに掲載できます。
StableDiffusionを使ったシステムは公開されているので、そういったものを使えば誰でも簡単に作れます。
ただある程度以上のものを作るとなると、自分で設定が必要になります。最低でも自分のコンピュータやサーバーに環境設定をしてライブラリを実行できる程度の知識は必要です。
予算もそれなりに必要です。自宅で環境を作るとなると高額なPCを用意する必要があり、サーバーを借りたほうが安く済むと思われます。
AI画像生成のメリット
大量の画像が必要だけど、今まで工数や予算の関係で実現が不可能だったものが、簡単に実現できるようになりました。例えば原始人の写真集を作ろうと思ってもそんなものを買う人は(ちょっとしか)いませんし、森にいって原始人の仮装をするのは相当の手間です。StableDiffusionを使えば簡単に原始人の写真を大量に作ることができる為、原始人の写真集が作れます。そんなものを欲しがる人はちょっとしかいませんが、まったく収益にならないわけではないです。土日を潰して原始人の写真集を作り、原始人の写真を必要としている人に提供することができるわけです。
AI画像生成のデメリット
この作業をやっていて一番気持ち悪いのが、やはりどこか不自然だということです。AI界隈でよく言われている問題で、リアルな人間に近づくほど強烈な不自然さを感じると言われています。
実際のポートレートを編集してる時は不思議と暖かい気持ちになるものですが、一方でAI画像の編集している時は本当に気分が悪く、吐き気によく似た感情に襲われます。ただ人の作ったものを鑑賞しているだけなら気が付かないと思いますが、実際の写真も普段からたくさん処理している自分からすると、強烈な違和感が消えません。
ただ今後改善していく可能性があり、そうなった時に倫理的な問題が問われることだと思います。
AI画像集
おことわり
このページは特に出典ありません。個人の感想なので、参考程度にお願いいたします。今後の世界を大きく変える技術ですので、公共財として、大切に育てていきましょう。現在、技術の進歩が凄まじく日進月歩の状態です。