画像生成AIのStable DiffusionでAI画伯に絵を描かせよう【Colabを使った画像作成編】

スマホを使ってAI画伯に絵を描かせよう

指示した単語から人間が描いたかのような絵を描いてくれる話題の画像生成AIStable Diffusion。

オープン化され誰でもアクセスできますが、自前のPC環境で実行するには知識やマシンスペックが必要です。

近頃はPCを持たない人も多いです。こんな素晴らしい仕組みをぜひみんなに体感してほしい！ということで、あえてスマホ操作だけでGoogle Colabを利用したStable Diffusionでの画像作成にチャレンジしてみました（スマホ画面コピーで構成されていますので、PCの方は見づらいと思いますがご容赦ください）。

なお、今回メインで使用するGoogle Colabにモバイル用の画面はないので、本当はPCを持っている人はPCが操作しやすいです

やることはとってもシンプル。Google Colabの環境でたった2つのコードをコピペ編集して実行するだけ。できあがった画像はGoogle Driveに保存され、スマホでアプリでみることができます。

事前準備であるHugging Faceのトークン取得がまだの方は前回記事を参照ください。
www.boardgamepark.com

スマホを使ってAI画伯に絵を描かせよう
Google Colabでのノートブック作成
GPUの利用設定
コードの記述（基本はコピペでOK）
コードの実行
呪文探しの底なし沼へようこそ！
画像生成AIによる時代の転換機に立ち合おう

Google Colabでのノートブック作成

まず、プログラムを動作させるため、クラウドでのpython環境であるGoogle Colaboratoryのノートブックを作成します。
colab.research.google.com

Colabにアクセスしたら「ノートブックの新規作成」を選びます。

白紙のノートブックが表示されます。ここにコードを記述して（基本はコピペですので心配無用です）実行していきます。

GPUの利用設定

コードの記述前にノートブックにGPUの設定をします。AIの演算処理にGPU（PCにおけるグラフィックボード）の利用が必要となるため、ONにするよう設定します。

メニューから「ランタイム」を選び、「ランタイムのタイプの変更」を選択します。

ダイヤログがでてきますので、GPUを選択し「保存」を押します。

なお、このGPU設定がないと本コードでは実行時にエラーとなります。作成するノートブック（プログラム）ごとに設定が必要ですので、実行時にエラーがでるようなら設定されているかを確認してみてください。

コードの記述（基本はコピペでOK）

今回記述していくコードは2つ。

モジュールのインストールと設定
画像作成

です。

本来は、

モジュールのインストール
各種設定
画像作成

の3プロセスですが、クラウド環境のColabでではインストールされた機能を含めて定期的（操作しないと１．５時間、操作していても１２時間）に仮想マシンがクリアされるため、統合して2つのコードとしました。

コード欄がなければ＋ボタンを押して入力フォームを表示させ、以下の２つのコードをひとつずつコピペして編集していきます。

# Google Drive との連携
from google.colab import drive
drive.mount('/content/gdrive')

# diffusersパッケージのインストール
!pip install diffusers==0.2.4 transformers scipy ftfy python-ulid

# StableDiffusionパイプラインの準備
from diffusers import StableDiffusionPipeline

pipe = StableDiffusionPipeline.from_pretrained('CompVis/stable-diffusion-v1-4’, use_auth_token='YOUR_TOKEN')
pipe.to('cuda')

ここで、YOUR_TOKENの部分を、準備編で取得した自分のトークンの文字列に置き換えてください。

# 画像の作成と保存
image_number = 5
prompt = 'black dragon'

for i in range(image_number):
 image = pipe(prompt)["sample"][0]
 image.save('/content/gdrive/MyDrive/image'+str(i)+'.png')

ここでは、作成する画像枚数の設定とAIに渡すpromptの部分を修正します。

5のところを好きな数に
'black dragon'のところを、'cute white cat' 'hokusai landscape' 'mona lisa reality'など、英単語を並べます。（いわゆる「呪文」と言われるAIへの指示）

コードの実行

２つのコードの修正が終わったら、のコードの左上にある再生を示す三角ボタンを押して実行します。１つ目のコードが完了したら２番目のコードと順に実行させていきます。画像生成を繰り返す場合は、２番目のコードのみを編集～実行を繰り返していきます。

なお、今回Google driveに保存しますので、初回連携時に認証のダイヤログが出てきますので承認してから進みます。

無料版のColabでは、1番目のコードは3分弱、2番目のコードは画像1枚あたり1分弱くらいで完了するイメージです。

コードの実行が成功すると、Google driveに画像が保存されますので、あとはご自由に。

AIが自動で作る画像につき若干崩壊している画像もあります。いくつか作って好みの画像を保存するとよいでしょう。

呪文探しの底なし沼へようこそ！

風景画から人物画、アニメ風の絵までなんでもござれのStable Diffusion。例えば、下の画像は“totoro Goch sunflower”でゴッホのヒマワリ風トトロができるわけです。

どんな絵ができるかは「呪文」とも呼ばれるプロンプト次第。指示次第でどんな絵も描いてくれるわけですから、呪文探しに熱中すること間違いなし。無料のGoogle Colabの利用制限にすぐに引っかかるかもしれません。

画像生成AIによる時代の転換機に立ち合おう

実際に画像作成してみると体感できますが、半端ないクオリティ。

こんなツールが一般利用できるようになったことはクリエイティブ業界にとってパラダイムシフトと言ってもよい出来事です。

「どんな絵を描くか」ではなく「どんな絵を描くようにAIに指示するか」に変わっていくわけですね。

例えば、ブログのアイキャッチ画像は、フリー画像検索や素材購入が不要となり、AIに頼めばOK。最近ではAIが描いた絵が美術展で優勝するニュースや、AI画像を下書きに筆を入れて作品にするアーティストも登場しています。

https://www.google.com/amp/s/www.gizmodo.jp/amp/2022/09/ai-art-wins-exhibition.htmlwww.google.com
Stable Diffusionの開発元のstability.AI社は、かのリンカーンの演説をもじって
AI by the people, for the people　
と宣言しています。

高度なA I技術を一部の企業や政府に独占させずにオープンに利用できるようにするコンセプト。Stable DiffusionやGoogle Colabが無料で利用できるなんて、本当に今の時代に生まれてよかったなと思います。

クリエイティブ界隈の時代の転換点に立ち会うべく、みなさんもぜひ体感してみてください。
↓画像から別の絵を描くimg2imgはこちら
www.boardgamepark.com