画像生成AIを触ってみた

画像生成AI「Midjourney」に手を出してみました。
触った感想や、思ったことをつらつらと。

画像生成AIに手を出した理由

触ってみたら、あまりに沼だったので、
手を出したのは、たった2日前のことなのに、
今このブログを書き始めようとしたところで、
「何で私、Midjourneyに手を出したんだっけ……?」
と、しばし考え込む。

………。

あぁ、そうだ。
元々はシステム開発のデザイン設計に使えないかと思ったんだった。


フリーランスになって、
どこかの会社のプロジェクトに参画する形で引き受けるタイプの仕事と、
個人で引き受けるタイプの仕事があり、
前者の仕事ならば、ちゃんとデザイナーがいるのだけど、
後者の仕事では、自分でデザインしないといけない。

システム開発を建築に例えると、
私は大工であって、左官屋ではないので、
構造的には、それなりに良い家や家具を作れるけど、
最後の仕上げの壁紙とか漆喰塗りとかは、
出来なくはないけど、イマイチぱっとしたものにならない。

仕事を引き受ける時には、あらかじめ、そのことを伝えて
了承してもらった上で引き受けているので、
デザインのことで、誰にも何も苦言を呈されたことはないのだけど、
自分自身が、どうにも納得できる仕上がりにならないことが歯がゆい。

システムは、見えない部分の構造がしっかりしていることが大事。
だけど、やっぱり最終的な見た目も大事で、
そこまでしっかりしていないと、トータルとして胸を張れない。

誰かデザイナーと組んだ方がいいかなぁ…、
でも、うっかり下手なデザイナーと組んだら、逆にストレスだしなぁ…、
実装は私の方でするから、要件を出したら、
「こんな感じのデザインで、どうですか?」
って、良い感じのデザイン案を出してくれるパートナーがいるといいんだけどなぁ…。

と考えていて、ふと、
あれ?これってAIで行けるんじゃない??
確か少し前に知人が、
テキストから画像を自動生成してくれるAIで遊んでいる投稿を挙げてたよな…、
と思ったのが、Midjourneyに手を出した経緯。


結論から言うと、
「システムのデザイン案を出してもらう」という使い方はできなかった。

Midjourneyは素材用のオシャレな画像を生成するのに適したツールで、
「漠然としたイメージを伝えると、超シャレた画像を作成してくれる」
ことは出来るのだけど、
「システム要件を踏まえて、適したデザインを提示する」
という機能は有していなかった。

Midjourneyが作成してくれたホームページ画面


ただ、ちょっといじってみただけでも面白い感じだったので、
元々の目的に関しては、ひとまず置いておいて、
イコン画像とか生成できるかなー、と色々試してみた。

アイコンを作ってみた

Midjourneyというのは、
キーワードになる言葉を指示すると、そこから想起される画像を生成してくれる代物。

たとえば、

icon house

と指示するだけで、いきなり、こんな画像を生成してくれる。

"icon house"で作成された画像

「背景は、いらないんだよなー」
と思ったら、

icon house, no background

という風に、no backgroundを追加すれば、

"icon house, no background"で作成された画像

こんな風になってくれる。

少しのキーワードで画像を作ってみてから、
自分のイメージに近づくようにキーワードを足したり、変えたりしていく感じ。

自分のイメージに近づけるには、どんなキーワードを使えばいいのか、
Midjourneyについて記載しているブログや、他の人たちの使い方を参考にして情報を集めつつ、自分で試して画像を作ってみたりしながら、
キーワードの効能を探っていく形。

キーワードは、まるで呪文で、
知人がTwitterで、Midjourneyの画像を上げながら、
呪文呪文と言っていたのが、よくわかった。

漠然としたイメージのものを描いてもらった

「針金で球体が繋がっている、幾何学的なオブジェを描いてほしいな」
自分でも、ぼやっとしたイメージのものを描いてみてもらえないかと思い、
関連しそうな単語を連ねた呪文を唱えてみた。

icon of metal spheres network which is shining, thin network, 3D, watercolor, white background

呪文に応えて、Midjourneyが生成してくれた画像がコチラ。

幾何学的なオブジェ

そうそう、こんな感じ!

お次は、自分でも完成形のイメージが全くついていないのだけど、
これをNの文字っぽくできないかと、呪文を唱えてみた。

isometric 2d icon of the network object, thin silver wires connecting spheres and shaping letter N, ten spheres are various colors, i, white background

Nの文字っぽくした幾何学的なオブジェ

なるほど、こう来たか。

悩みどころ

なかなか楽しいMidjourneyだけど、一番苦戦したのは、
「どうしても、シャレたものになってしまう」
というところ。

私がまだMidjourneyを扱いきれていない可能性も十分あるけど、
Midjourneyが生成する画像は、基本シャレていて、
あっさりシンプルにするのが難しい。

シャレたものでいいじゃないか、と言われそうだけど、
シャレた画像というのは、それだけ情報量が多いので、
その画像が主役ではないところに配置したいケースや、
画像をたくさん配置したいケースに向かない。

たとえば、私は生成したオブジェ画像を、
この↓ホームページ画像に配置したかったのだけど、

myホームページのトップ画像

ここにシャレたオブジェを配置すると、
なんか浮く…。

シャレた画像を配置すると…


どうしたら、もっと馴染むようにシンプルに加工できるだろうか…、
flat designとかFlat vector illustration styleとか2D iconとか、
色々呪文を探してみたのだけど、
どうにも、うまくいかない。

本のアイコンについては、flat sepia colorsと指定したら、
そこそこ馴染むものができたけど、Midjourney全体的にシンプル化が難しい印象。
(シンプル化のコツがわかる人いたら、教えてくださいm(_ _)m)

本のアイコンを配置

Midjourney沼

Midjourneyを触り始めて少ししたところで、
「これはヤバい、沼だ…」
と思い始めた。
際限なく、いじり続けてしまう。

これは、AIというより、魔法錬成ゲーム。

効能のあるキーワード=呪文を探していく工程が楽しい。

たとえば、
isometricというキーワードを手に入れたら、出来ることが一気に増えて、
おおぉぉ!となり、
そこに、既に持っていたcolor pensil paintingというキーワードを掛け合わせてみたら、
「なんだ、これは!? 雰囲気のある素敵な画像になったぞ!」
となっていく。

the shop with bread, isometric, color pencil painting, white background

色々な呪文を放り込みすぎると、途中で訳がわからなくなるので、
その時には、いったん、リセットして、1つ1つの呪文の効能や、
シンプルな掛け合わせでの効能を整理していく。

思わず、Notionで実験メモを取って、効能を整理し始めた。

呪文実験メモ in Notin


手探りで、魔法の呪文を探し求めて、
手に入れた呪文を、色々掛け合わせて効能を探って、
出来ることを増やしていく。

大昔、攻略本のないRPGを、
地図を方眼用紙に書き起こしたり、呪文の効能をノートにメモしたりしながら遊んでいた頃を思い出す。

そういえば、高校生の頃に、
「あらゆる言葉が魔法になる」という魔法錬成ゲームが欲しかったけど
巷に存在しなかったから自分で作ってたな、私。
思いっきり私のドストライクじゃないか、Midjourney。
どうりで、沼なわけだ。

2日間で無料枠+ベーシックプラン1か月分を、ほぼ使い切ってしまった。
「使用量制限あるのかー。どうしよっかなー」
と最初はプランを悩んだけど、
結果的には、月あたりの使用回数に制限のあるベーシックプランにしておいて
本当に良かった。
無制限に使えてたら、間違いなく生活に支障を来たすもんな、これ。

触って思った「これからの仕事を選ぶ基準」

Midjourneyを触りながら、
「これからの仕事を選ぶ際の基準は、『AIに勝てなくてもやりたいこと』になるのかもな」
と思った。
(そもそも、"仕事とは何か"という話もあるけど)

ChatGPTを触っていた時は、あくまで『優秀な助手or後輩』という感覚だった。
プログラミングやシステム開発に関しては、
既に自分に、それなりの知識とスキルと自信があるので、
たとえば優秀な後輩が、自分の知らないことを知っていたとしても、
新たな知識を得られてラッキー、と思うだけで、
自分の自信が揺らいだり、存在意義云々で悩むことはない。

だけど、例えば私が今からイラストレーターになろう、と思ったとして、
どう考えても、私よりもあらゆる面で上手いAIがいたら、
果たして、自分の存在意義に悩むことなくイラストレーターを志すことができるだろうか?

そんなことを、Midjourneyを触りながら思った。

そう思ってから、それは、もうずっと以前に、
将棋、囲碁、チェスの世界で投げかけられていた問いだったな、と気づいた。

普通のコンピューターで動くアプリですら、とうの昔に素人では勝てないレベルになっている。
スパコンになれば、プロすらも悩ませるレベル。

だけど、棋士たちは、今も彼らの世界で研鑽しあっている。
AIを相手に指し手を研究することもある、なんて話も何かで読んだ。

今から将棋や囲碁のプロを目指す子供たちは、
スタート地点で既にAIに勝てないレベルだし、
もしかしたら、彼らが見事プロになる頃には、AIは人間が決して勝つことのできない領域にいっているかもしれない。

だけど、「AIに勝てない」ことが、
彼らが将棋や囲碁をやらないことの理由にはならないだろう。
やりたいから、やる。
勝ち負けの世界ですら、そうなんだよな。