【連載】どれ使う?プログラミング教育ツール

言葉から画像を生成してくれるAI、「DALL-E 2」を試してみた(前編)

〜思い通りの絵を描かせるのはなかなか大変……!

AIが描いたすごそうな絵をSNSやニュースで目にしたことがある方、多いのではないでしょうか。話題になっているのは、言葉で指示をするだけでAIが絵を生成する画像生成AI。実際のところどんな感じなのか、試してみました。

今回使ったのは会話型AI「ChatGPT」を開発したOpenAIの画像生成AIシステムの「DALL-E2」(ダリ ツー)です。この前編ではいろいろな画像の生成に挑戦。次回後編では、画像をもとにした画像アレンジを試してみます。

言葉で指示をするだけで本当に画像が出来上がる!

利用は、OpenAIの「DALL-E2」のサイトから。アカウントがあればすぐにログインして使用できるのですが、現在利用は画像生成のためのクレジットを購入する必要があります。

2023年4月6日以前にOpenAIの会員になっていると、無料で利用できるクレジットが付与されていて、限定回数利用できます。使用の年齢制限はChatGPTと同様で、13歳以上、18歳以下は大人の承諾が必要とOpenAIが示しています。

「DALL-E 2」のサイト[Try DALL-E]ボタンで入る

ログインすると次のような画面になります。下の方に生成された画像例が並んでいて、こんな感じのがささっと作れるのかなぁと期待が高まります。

言葉でどんな画像を作りたいか指示を書くだけ。画像生成のクレジットを持っていない場合、中央にクレジット購入を促すボタンが表示されます。

指示は英語で書きます。とりあえず、葛飾北斎の作品に出てくるような海でパンダがサーフィンしている絵を浮世絵テイストで描かせてみましょう。長めの説明を書いて、[Generate]ボタンをクリック! すると4パターンが瞬時に生成されました。

同じ指示文から4画像生成される

でも、なんとも、微妙……。構図も、タッチも、思い描いていたものとはだいぶ違います。しかし、意外と右端の絵なんかは、勢いがあってこんな感じにするのもありかもしれません。

「SUMMER SALE!」の文字を足してちょっと目を引く感じに。※画像生成AIで作った画像です

思い描くような絵がちっとも生成できない!!

めげずに次、行ってみましょう。説明が細かすぎたかと思い、もうちょっとシンプルに配置を指示する程度に。「月に立つパンダの宇宙飛行士。後ろに宇宙船。ハイクオリティの3Dデジタルアート」の指示で生成したのがこちら。

パンダの宇宙飛行士がどうやっても変な感じに仕上がっている

またもや、これじゃない……という感じに。小さく4枚並んでいるとなんとなくそれっぽくみえるのが不思議です。細かいところがぼけているような状態で絵が仕上がっている感じでしょうか。ひとつひとつ見ていくと、かなりあやしい。

リアルな写真スタイルを指定した方がいいだろうか? とか、見本の指示文を真似した方がいいだろうか? とか、紆余曲折を経て、あまり具体的な絵を思い描かずに判断を委ねよう、と思って試したのがこちら。「ビーチでビールをもってリラックスするパンダ。デジタルアート」です。

だらっとした感じは伝わってくるがパンダの特徴と人のポーズの特徴の掛け合わせ方が微妙

気が抜けた感じのがパンダが並びました。たしかにパンダの心は指示通りリラックスしているのかもしれませんが、それ以上に、絵の作り自体がリラックスしちゃった感じで崩れ気味です。かろうじて左から2番目あたりどうにかなりそう。文字を足すとこんな感じです。

文字だけを足してゆるい雰囲気に。※画像生成AIで作った画像です

ここはもう、パンダから離れてもっとシンプルな形のものにしようと、「青い木の椅子の上にある赤いりんご。デジタルアート」とごくシンプルに指示してみました。

比較的どれもまぁまぁまとまっている

うん、これが一番いい感じです。なんかちょっと使えそう。左から2番目に文字を足すだけで……。

本の表紙にありそうな雰囲気。※画像生成AIで作った画像です

なんだか、ちょっと本の表紙っぽい雰囲気になりました。ようやくちょっとだけ納得。

なお、指示を日本語でも試してみましたが、「深海を泳ぐパンダ。デジタルアートで」と日本語で描いたらパンダとは全く違う微妙に実在しないあやしい海の哺乳類が描かれたので、日本語での指示は期待しないでおきましょう。

プロンプトの書き方に注目が集まる

いろいろと試してみましたが、なかなか思うような絵を生成するのは難しい。AIに指示をするときの言葉をプロンプトと呼び、最近ではプロンプトの書き方が生成系AIの使いこなし術として注目されています。何度も失敗を繰り返すと、この絵のプロンプトどう書いたの? とすごく気になるもので、まさにプロンプト次第であることを実感しました。

サンプルをクリックすると、どんな指示で生成されたものなのか、プロンプトも確認できる

画像生成AIは他にも「Midjourney」「Stable Diffusion」などが有名で、試している人もたくさんいて、「DALL-E 2」も含め、効果的なプロンプトの書き方を指南している人もいるほどです。

なお、OpenAIは、「DALL-E 2」で生成した画像を公開したり販売したりすることは禁止していません。ただし、その画像を画像生成AIが生成したことを明らかにするよう勧めています。生成した絵を完全に人が描いたかのように誤解させたり、写真が本物で本当に起きた出来事のように思わせたりしないように、と示しています。

社会的な混乱を招かないこと、技術的な誤解を与えないことは重要ですから、楽しい気持ちで生成した画像を公開するときには、いったんそれが知らない人からどう見えるかを考えて、適切な公開範囲を考えたり、注意書きを加えるなどの検討をするのが大切です。

後編では、自分で画像をアップロードしてバリエーションを作ったり、別の要素を描き加えたりという画像生成をレポートします。画像生成AIにおける権利の考え方や、議論すべき点などについても触れたいと思いますので、引き続き後編もご覧ください!

狩野さやか

株式会社Studio947のデザイナー・ライター。ウェブサイトやアプリのデザイン・制作、技術書籍の執筆に携わる。自社で「知りたい!プログラミングツール図鑑」「ICT toolbox」を運営し、子ども向けプログラミングやICT教育について情報発信している。