The Graphic Design Review

61

画像生成AIはデザイン、イラストレーションになにをもたらすのか?

画像生成AIはデザイン、イラストレーションになにをもたらすのか?

昨年来、これまで学術的な研究領域で探究されていた画像生成AIが一般ユーザーが気軽に利用できるウェブ上のサービスとして公開され、さまざまな反響を呼んでいる。コンピュータが描いたとは思えない高品質なイメージや、人間の発想を超えた奇妙なイメージをSNS上で見かけた人も多いだろう。これらの画像生成AIの展開と、その社会的、文化的な問題をめぐる議論について俯瞰する。

バナー画像:Stable Diffusionで生成させた画像のサンプル

●ブレイクスルーの到来

 

画像生成AIはクリエイション全般の在り方を問い直すものとして、現在注目を集めている。とりわけ昨年(2022年)はその技術がインターネット上で公開されたり、アプリケーションによってより手軽に利用できるようになったことから「画像生成AI元年(*1)」ともいわれており、さまざまなサービスが提供されるようになった。以下では画像生成の歴史を簡単に踏まえつつ昨今の盛り上がりについて触れ、それらが具体的にデザインやイラストレーションにどんな変化を引き起こすのか、さらには画像生成の技術が私たちの文化にどのようなインパクトをもたらしているのか、考察していきたい。

 

歴史を振り返ると、AIによってイメージを生成することはかねてより試みられてきた。たとえば、ハロルド・コーエンが1979年に発表したプログラム「AARON(アーロン)」は画家でもあるコーエン自身の作品を学習させ、分岐条件を重ねることで「絵画」を自動的に生成させることに成功した事例だ。近年でも画像生成AIはたびたび話題になっている。2016年にはバロック絵画の巨匠レンブラントの作品を解析し、その作風を抽出して新たなイメージを生成する「The Next Rembrandt」プロジェクトが公開、2018年にはAIが描いたとされる絵が世界的オークションのクリスティーズで43万2500ドルもの価格で落札されるといったニュースがメディアを賑わせた。

 

こうした画像生成の技術は、機械による認識を対象の階層と関連させ人間の判断能力に暫近せんとするディープラーニング技術(*2)にビッグデータを通じた学習を組み合わせることで、近年大きなブレイクスルーを迎えた。2022年の1月に「DALL-E」、7月に「Midjourney」、8月に「Stable Diffusion」と立て続けにハイレベルなプログラムがリリースされ、社会的な関心を集めたことは記憶に新しい。とくに「Stable Diffusion」はオープンソースとなっており、同プログラムをベースに日本のマンガやアニメ的絵柄の出力に長けた「NovelAI」が開発されるなど、AIによる画像生成はニッチなマーケットも取り込みながらその裾野を広げつつある。

 

任意の単語をいくつか打ち込めば、誰でも簡単に「絵が描ける」時代がやってきた。今や画像生成AIの技術は、基礎研究の段階からデザインやイラストレーションも含む各領域での応用にその課題が移行してきている。その状況を象徴するかのように、画像投稿サイトのpixivでは、AIによって生成された作品に「AI生成」と表示する機能が2022年10月に追加され(*3)、同年の12月にはストック画像サービスのAdobe Stockでも、提供素材のタイトルに「Generative」「AI」といったキーワードを明記するガイドラインが設定された(*4)。このように、すでに現場での対応は始まっている。

画像生成AIはデザイン、イラストレーションになにをもたらすのか?
Stabe Diffusionから「landscape Japanese print ukiyoe」というキーワードで生成されたイメージ

●AIとクリエイティビティ

 

pixivは編集者やデザイナーがイラストレーター起用の参考にすることもあるサイトであり、Adobe Stockはストックされたイラストレーションをユーザーに提供するサービスだ。このような両サイトの性格を踏まえると、画像生成AIによって生まれたイメージは、早くもそれ以外の、つまり画像生成AIを使用していないイメージの競合相手になっていることがわかるだろう。

 

しかし現段階でいえば、画像生成AIによってイラストレーターの仕事がすぐに奪われてしまうということにはならなさそうである。現在、画像を生成する方式としてはテキストを入力するプログラムが主流になっているが、CGディレクター、アートディレクターの横原大和はそれを非効率であるとし、「ガチャのような感じで、1日試してもほしい絵が出てこないことも多く、それくらい時間かけるなら自分で描くかリファレンスを探したほうが良いという結果になりがちです(*5)」と述べている。現状のAIによる画像生成はトライアンドエラーを繰り返すしかなく、横原はその点が「非効率」であると指摘するのだ。

 

イメージがその場その場で新たに生成されてしまうとなると、角度や配置の変更のような微調整は確かに難しそうだ。それに加え、人間の腕や指の本数が合わなかったりするなどAIが苦手としているディテールもあり、生成された画像をそのまま実際の仕事で使用するハードルはまだまだ存在している。また、生成されたイメージを選定したり、修正を施したりする人間のディレクション作業も必要になってくるだろう。

 

デザインの問題を抜きに素材としてのイラストレーションに限って考えてみたとしても、まだ現在提供されているストックイラストレーションのほうが使い勝手は良い。なぜなら膨大なデータを学習しているせいか、現在の画像生成AIは単純な単語の入力では記号的な明快さに欠けるイメージが生成されてしまう。ストックイラストレーションは一般に「明るくてシンプル」「何を伝えたいかが分かりやすい」といった傾向が求められているのだが(*6)、それを画像生成によって実現するためには多くの単語を入力する必要があるのだ。将来的にはこうした作家の個性をあまり求められない領域は画像生成AIに代替されていくのかもしれないが、現状では生成の手間を考えると、既存のサービスを利用したほうが効率的である。

画像生成AIはデザイン、イラストレーションになにをもたらすのか?
Stable DIffusionから「handshake」というキーワードで生成されたイメージ

●法と倫理をめぐって

 

それに加え、生成された画像の利用に関してはさまざまなトラブルが予想される。弁護士の柿沼太一は予想される問題に対して現行法の範囲内でどのように対処できるのかをブログで紹介しているが(*7)、AIによって生成されたイメージについては、今後の解決事例や裁判例が積み重ねられる必要があるだろう。また、生成画像の倫理面についてもまだまだ議論が必要だ。

 

象徴的なのは、8月にベータ版がリリースされた「mimic」のサービス一時停止である(現在は再開)。これは30枚以上のイラストレーションをAIに学習させ、描き手の個性を抽出した画像を生成することができるサービスだ。「mimic」はメディアを通じてリリースが報道されるやいなや、他人の作風を勝手に学習させることで盗作の温床になってしまうのではないかと批判が殺到した(*8)。

 

だがその一方で、画像生成AIに対するイラストレーターたちの考え方はさまざまだ。自らの作風がAIに学習されてしまうことについて1990年代より活動するベテランのマンガ家、イラストレーターの七瀬葵は、「私の絵はたくさんAIの学習元とされているdanbooru に全作品網羅で登録されてるけど嫌ではないし削除要請もしない。むしろ誇らしく思う。AIには私の血が一滴入っているように思う(*9)」と発言しており、肯定的だ。しかし「盗作」についての懸念が払拭されたり、生成された画像に対する社会的モラルが形成されたりしないことには、発注側にもAIによるイラストレーションを積極的に起用しようという機運は育っていかないだろう。

 

こうした法律的、倫理的な問題に関しては今後落としどころが探られていくだろうし、技術的なものについても課題解決の契機になっていくだろう。インタラクションデザイナーの深津貴之は画像生成AIに対して、将来的には入力型ではなく対話型にシフトし、細かい調整を指定できるようになることを予想している(*10)。その方向性は、2023年1月2日にGoogleが発表した画像生成モデル「Muse」からもうかがうことができるだろう。同モデルはまだ一般に公開されていないが、マスク機能を使って画像の一部を操作することが可能であり、インタラクション性が向上していることは明らかだ(*11)。腕や指の表現に関しても、NovelAIはそれが自然になるようアルゴリズムを調整しているようだ(*12)。

画像生成AIはデザイン、イラストレーションになにをもたらすのか?
「mimic」のトップページ

●人間との協調と今後の展望

 

その一方、直接エンドユーザーの目に触れない中間制作物であったり、脇役的に使うのであれば、画像生成AIの活用は現状でも十分考えられるだろう。ゲームなどのコンセプトアートであればアイデア出しの補助として利用することができるし、打ち合わせ段階の資料としてならば、「Stable Diffusion」の機能である「img2img」も活用できそうだ。画像とテキストを組み合わせたイメージ生成を可能にするこの機能を用いれば、ベースとなる絵柄を言葉で方向づけすることによってカンプを短時間で何枚も制作できるだろう。また、背景や小物、テクスチャーや装飾といった用途であれば、そのままグラフィック素材として利用することもできるはずだ。

 

その点を踏まえると、先ごろ発売された『CG WORLD』2023年1月号と『SFマガジン』2023年2月号が、ともにAIによって生成された画像を用いて表紙制作を行ったことは、AIによる生成画像の活用が次のフェーズに移行したことを感じさせる出来事だったといえる。『CG WORLD』の表紙はコンセプトアーティストの田島光二が、『SFマガジン』の表紙は深津が手がけている。両誌はともに特集としてAIを取り上げており、表紙制作での生成画像の使用はそれにのっとったものだった。

 

しかし両者に大きな違いも存在していることも見逃せない(*13)。『CG WORLD』のほうは約800枚の生成画像から選ばれたイメージをもとに田島が3Dモデルを制作して完成させている。つまり、色彩や造形などにアレンジが加えられ、純粋な生成画像による表紙ではなくなっている。これに関して田島は、生成された画像だとインパクトはあっても作者としてその良さを理解してないように感じてしまうので、最終的に自分で手を動かすことを選択したと述べている。

 

一方、『SFマガジン』の表紙を手がけた深津は、生成された画像をそのまま納品するという縛りを自らに課した。プロンプト(画像を生成するための文章)自体を自動生成させて生み出した数万の画像から最終的に選ばれたイメージは、加藤直之のようなペインタリーなSF系イラストレーターの仕事を連想させるものとなった。両誌の表紙は、いずれも一見しただけでは画像生成AIが使用されているとは思えない。ネット上では「chichi-pui」というAIイラストレーション専用の投稿サイトもすでにローンチされており、プログラミングのように長い複雑なプロンプト(*14)によって完成度の高いイメージを生成しようと試みる投稿者も存在している。こうしたコミュニティから近い将来、プロとして活動する「イラストレーター」も登場する可能性も十分にあるだろう。

画像生成AIはデザイン、イラストレーションになにをもたらすのか?

『CG WORLD』2023年1月号(ボーンデジタル)

出典:https://www.borndigital.co.jp/book/28612.html

画像生成AIはデザイン、イラストレーションになにをもたらすのか?

『SFマガジン』2023年2月号(早川書房)

出典:https://www.hayakawa-online.co.jp/shopdetail/000000015312/shurui_71_SFM/page1/order/

●AI画像のネタ消費から見えるもの

 

画像生成AIはどのようにデザインやイラストレーションに活用されるのか、ここまで具体的なケースと関連させながら書いてきた。最後に、日本のTwitter上では生成された画像をある種のネタとして楽しむ状況が生まれていることについて触れておきたい。ラーメンを手づかみで食べる人爆乳機関車など、私たちが発想しないようなイメージを生成するAIの振る舞いは、確かに興味深いものがある。

 

だが、こうした動画生成AIの基盤にある情報技術は、アレクサンダー・R・ギャロウェイも指摘するように、原理的には「管理=制御」を目的として発展してきたものでもある(*15)。日々アプリから通知される予定に従い、アルゴリズムからサジェストされた動画鑑賞で余暇を過ごすような私たちは、ある意味で情報技術に生活を管理されている(*16)。そんな管理=制御型社会のために私たちは日々データを提供し、膨大なデータのコレクションをインターネット上に築き上げることになった。

 

このデータベースとアルゴリズムが手を取り合って、「生態系としてのアーカイヴを構築し、人間の手を介さずともネットワークの中で自律的に生成変化(*17)」するまでになった。つまり、画像生成AIが私たちにもたらした驚きとは、これまで私たちを管理していたビックデータが、いつのまにか自律的なフィードバックを獲得していたことに対するものだったのではないだろうか。これまで、いわゆるアーカイヴとは人間によって作られたものだった。しかしそれがアルゴリズムによっても担われるようになった昨今の状況は、抜本的な変容の最中にある。「人間は波打ちぎわの砂の表情のように消滅するであろう(*18)」というミシェル・フーコーが『言葉と物』の最後に記したその一言が、今まさに実現しつつあるのだ(*19)。ゆえに画像生成AIによるイメージとは、コンピューターによるアルゴリズムのシンボリックな可視化であり、Twitterでの「バズり」は、そのようなアルゴリズムのいわば他者性の、ユーモアを伴った受容として理解できるのではないだろうか。

 

画像生成AIの発展は、情報技術の(管理的ではない)クリエイティブな側面に新たな角度から光をあてることになった。学習を経て生成されるイメージの数々は、デザインやイラストレーションと今後どのようならせん構造を描いていくのだろうか。変化は着実に起こっている。表現面や倫理面など課題は山積しているものの、人間と技術(AI)の関係が新しい局面を迎えていることは間違いないはずだ。

画像生成AIはデザイン、イラストレーションになにをもたらすのか?
AI画像生成が生み出した、ラーメンを手づかみで食べる女性のイメージ(google画像検索による)

塚田優 つかだ・ゆたか
視覚文化研究。2014年、『美術手帖』第15回芸術評論募集に「キャラクターを、見ている。」が次席入選。美術、イラストレーション、アニメーションを中心に各種媒体に寄稿を行う。おもな共著に『グラフィックデザイン・ブックガイド』(グラフィック社、2022年)がある。最近の論文は「雑誌におけるイラストレーションの定着とその特徴について——1960年代の言説を中心に」『多摩美術研究』第10号、2021年。

1:吉本幸紀「クリエイティブAIの過去、現在、そして未来」、『CG WORLD』2023年1月号、ボーンデジタル、2023年、p. 31

2:同前、p. 30

3:「AI生成作品の取り扱いに関するサービスの方針について」https://www.pixiv.net/info.php?id=8710

4:「Generative AI Content」https://helpx.adobe.com/stock/contributor/help/generative-ai-content.html

5:「インタラクションデザイナー・深津貴之×CGWORLDアドバイザリーボード座談会 アーティストとAIの“共創関係”を考える」、『CG WORLD』2023年1月号、ボーンデジタル、2023年、p. 42

6:LOCUS. AND WONDERS.『写真で稼ごうハンドブック ストックフォトのはじめ方』マイナビ、2014年、p. 76

7:柿沼太一「Midjourney、Stable Diffusion、mimicなどの画像自動生成AIと著作権」https://storialaw.jp/blog/8820

8:「イラストAI「mimic」運営にイラストレーターが直撃 炎上とサービス停止、その裏側」https://kai-you.net/article/84728

9:https://twitter.com/Aoi__Nanase/status/1605713583333335040

10:深津貴之「クリエイティブAIとアーティストの未来を探る」、『CG WORLD』2023年1月号、ボーンデジタル、2023年、p. 35

11:田口和裕「グーグル、高クオリティかつ高速なテキスト画像生成モデル「Muse」を発表」https://ascii.jp/elem/000/004/119/4119461/

12:新清士「すさまじい勢いで世界を変えている画像生成AI」https://ascii.jp/elem/000/004/107/4107997/2/

13:これらの表紙制作フローについて、詳しくは『CG WORLD』2023年1月号に掲載されているメイキング記事を、『SFマガジン』2023年2月号については深津貴之によるウェブ記事「AIでSFマガジンの表紙をつくったメイキング話」https://note.com/fladdict/n/n6bdf39147aebを参照されたい。なお、『CG WORLD』にはその他のAI活用事例も紹介されており、『SFマガジン』では深津が画像生成AIを使い、小説家の野﨑まどと共作したAI絵本が掲載されている。

14:画像生成AIによって生み出されたイラストレーションは、キャプションとしてプロンプトが併記されることがしばしばある。「chichi-pui」の場合は投稿時にプロンプトを入力するフォームが実装されているし、TwitterでもALT機能を使ってプロンプトを画像に紐づけているケースが散見される。こうした情報の公開は、集合知となって画像生成AIの洗練に寄与しているだろう。

15:アレクサンダー・R・ギャロウェイ『プロトコル 脱中心化以後のコントロールはいかに作動するのか』北野圭介訳、人文書院、2017年、p. 240

16:もちろんこうした事態は突然現れたものではなく、ギャロウェイは『プロトコル』において、歴史的に管理=制御型の社会は、君主=主権型社会、規律=訓練型社会の次なる支配形式として登場したことを述べている。

17:久保田晃弘「機械学習とアーカイヴ」、『アイデア』400号、誠文堂新光社、2022年、p. 120

18:ミシェル・フーコー『言葉と物 人文科学の考古学』渡辺一民、佐々木明訳、新潮社、1974年、p.409

19:田中純、石田英敬、加治屋健司、安藤礼二「ミシェル・フーコーとアーカイヴ」、『軌跡』4号、多摩美術大学アートアーカイヴセンター、2022年、p.75-76

 

 

参考資料

北野圭介『制御と社会 欲望と権力のテクノロジー』人文書院、2014年

久保田晃弘「機械学習とアーカイヴ」、『アイデア』400号、誠文堂新光社、2022年、p120-123

徳井直生『創るためのAI 機械と創造性のはてしない物語』ビー・エヌ・エヌ、2021年

パメラ・マコーダック『コンピュータ画家アーロンの誕生 芸術創造のプログラミング』下野隆生訳、紀伊國屋書店、1998年

『CG WORLD』2023年1月号、ボーンデジタル、2023年

「話題の「AI絵師」って受け入れられる? 編集部メンバーで議論してみた」https://www.itmedia.co.jp/news/articles/2210/06/news144.html

公開:2023/01/24