親子ボードゲームで楽しく学ぶ。

世界のボードゲーム・カードゲームを楽しもう！初心者や子供におすすめなライトなアナログゲームを紹介します。

Stable Diffusionの追加学習モデルを使った画像生成（Trinart, Waifu Diffusion, furry, pokemon, Ghibli）

Stable Diffusion 雑記

無料公開されているお絵描きAIのStable Diffusion。風景画から写真風、アニメイラストまで、AIが様々な絵を描いてくれます。
www.boardgamepark.com
まだ発展途上の部分もあり、人物の瞳が歪んだり指が足りなかったりすることも。

足りなければ学習して成長するのがAI。
Stable Diffusionをベースに、追加学習で強化されたモデルが次々リリースされています。先日紹介した日本語対応に軸足をおくJapanese Stable Diffusionもそのひとつ。
ついに日本語対応した画像生成AI「Japanese Stable Diffusion」が登場したので使ってみた - 親子ボードゲームで楽しく学ぶ。

今回は無料公開されているもののなかで、2次元画像に重点をおいて追加学習したモデルの生成画像を紹介します。

Trinart Diffusion
Waifu Diffusion
SD Pokémon diffusers
Furry Model
Ghibli model
AIが生成する画像の権利ってどうだろう

Trinart Diffusion

トップバッターは国産のTrinart Diffusion。日本語小説AIである「AIのべりすと」のアルファ版サービスのモデルが公開されたものです。
AIのべりすと

Twitterでも「とりんさまAI」として絵を描いてくれるアカウントがあります。
https://twitter.com/trinsama?s=21&t=HYIThCj_3NVkW2SMajXu7Q

本家Stable DIffusionよりも2次元画像が強化されていることが特徴。特に柔らかなタッチのイラストが得意なようです。

Waifu Diffusion

続いてWaifu Diffusion。アニメ系の絵をたくさん学習して強化されたモデルです。
huggingface.co
ちなみにWaifuとは、英語圏のネットスラングでアニメのお気に入りの女性キャラのことだそうです。「俺の嫁」から転じて「嫁」のローマ字読みのWaifuとなっているのが面白いですね。

Waifu Diffusionにかぎった話ではないですが、2次元画像強化の学習は美少女絵が中心のようで、男を指定してもかなりの確率で女性が出てきます。

逆にオジサンを出すには至難の業。AIにメモリーに映る世界には、きっとオジサンなんてほぼ存在しないんでしょうね。デジタルの世界でも地位が低いようです。

そのかわり美少女に関しては人間が描いたものと（少なくとも私は）全く区別がつかないレベルの完成度になっていると思います。

2次元画像の領域では有料のNobelAIが頭ひとつ抜けていますが、無料で利用できるものの中ではWaifu Diffusionが抜群だと思います。

SD Pokémon diffusers

huggingface.co

ポケモン画像をたくさん学習して、ポケモン風の画像生成に特化したモデル。

サンプルの大統領ポケモンのように、テキストで指示すればいろいろなコンセプトのポケモンが出てきます。

既存画像と組み合わせるImg2img機能を活用したら「自分自身のポケモン」なんてのも作れそうですね。

下は既存のポケモンになさそうな、イルカとバッタのポケモンを描いてもらった結果です。

Furry Model

www.reddit.com
いわゆる「ケモナー」の英語表現がfurry。動物キャラに特化したモデルです。

ズートピアに登場しそうな動物キャラから猫耳少女まで、なかなかのクオリティで描いてくれます。

Ghibli model

スタジオジブリの画像生成に特化したモデルも登場しています。
www.reddit.com
これで絵を描かせると、ジブリ映画のワンシーンを切り取ったような登場人物の絵がでてきます。

AIが生成する画像の権利ってどうだろう

他にも様々なモデルがありますが、今回いったん自重したのが、アニメ特定キャラの特化モデル。

作風を真似るのと、特定のキャラそのものを描くのとは、権利関係の踏み込み度合いが違うかなと思った次第です。

AIが本物そっくりの画像を生成できるなか、これまでも微妙であった、著作物の権利とファンアートの問題は難しくなりますね。

公開画像で学習するAIに学習を禁じることは事実上不可能。作品を公開しないか、アナログののみで撮影も禁止にするくらいしか手段はありません。

また、今回登場のWaifu Diffusionなど追加学習元に画像の無断転載サイトがあることも課題。抜群のクオリティで話題のNobelAIは無断転載サイトの画像で学習し商売をしていることが批判されています。

盗まれた教科書を使って勉強したAIのアウトプットは罪なのか。

悪いのは盗んだ人で公開情報を使ったAIは当事者ではないという意見と、盗んだものを使うのだからAIも利用者も悪いという意見があります。

適法性はさておき「児童労働など問題ある農場で作られた豆のコーヒーを飲むべきか」と同じで、モラル的にはよくないことかもしれません。

後追いでの法整備が進んでいくかと思いますが、オープンな世界でのAIの発展と、著作者の権利の保護活動の両立は難しいなと改めて思います。

なお、プログラミングスキルのない私のものは参考にならないのでコードは記載しておりません。Google Colabでモデルを切り替えたい場合は、下記サイトで公開されているものが分かりやすいいと思います。
note.com