ChatGPTをリリースしたことで世界中の注目を集めているOpen AI。2023年9月には新たな画像生成AI「DALL-E3(ダリ・スリー)」を発表しました。
しかし、
- DALL-E3とはどのようなツールなのだろう?
- どんな画像を生成できるのか?
- どうやったら使えるのか?
このような疑問を持っている人は多いでしょう。DALL-E3はChatGPT上で利用できるAI画像生成ツール。生成される画像のクオリティが非常に高いのがポイント。
有料サブスクリプションのChatGPT Plusに登録する必要はありますが、それに見合った性能と利便性を備えています。
そこで本記事ではDALL-E3の特徴や強み、使い方などを解説します。また、よりよい生成結果を得るコツなども解説しているので参考にしてください。
DALL-E3の基本情報と特徴
DALL-E3は、2023年9月にChatGPTのサービスに盛り込まれた画像生成AIサービスです。他社の類似サービスとは一線を画す強みを有しており、一躍有名になりました。
DALL-E3の特徴は次の通り。
- 生成される画像のクオリティが高い
- ChatGPTベースかつ日本語対応なので利便性が高い
- 画像の出力内容を細かく指摘できる
それぞれの特徴を詳しく解説するので参考にしてください。他の画像生成AIサービスと比較していかにすぐれているかがわかるはずです。
生成される画像のクオリティが高い
DALL-E3最大の特徴・強みとして、生成される画像のクオリティが高い点が挙げられます。実際の画像を見てみましょう。今回は条件として以下を設定しています。
- ジャパニメーション的な絵柄
- 制服を着た少女が空を見上げている
- 髪の毛の色は黒色
- やや西陽が差し込んでいる
- 背景には木がある
生成された画像は下図です。
まず、一般的なアニメや漫画作品と比較して遜色のない画力で出力されています。
また、「西陽が差し込んでいる」「背景には木がある」といったオーダーにもきちんと答えられています。「ジャパニメーション」という要望も拾えているでしょう。
そのほか、右肩に学生鞄の紐らしきものが描写されるなど、プロンプト以上に気の利いた出力がなされている部分も見受けられます。
ChatGPTベースかつ日本語対応なので利便性が高い
プロンプトが日本語でも問題ありませんし、ChatGPTに「DALL-E3」というワードとともに指示を打ち込むだけでいいのもポイント。
チャットで「もうすこし暗い雰囲気にしてほしい」「追加でこれも描いてほしい」と言えばすぐに対応してくれます。
画像生成AIサービスには、使い方がむずかしいものもあります。しかしチャットで話しかけるだけのDALL-E3は、とても使いやすい部類に入るでしょう。
画像の出力内容を細かく指定できる
画像の出力内容は、かなり細かく指定できます。たとえば以下のような点を指定可能。
- 縦のサイズ/縦が何ピクセルか
- 横のサイズ/横が何ピクセルか
- テイスト/「ポップ」「リアル」「ジャパニメーション」など、どのようなイメージか
- 文字/画像中に文字を入れたいか、入れたいとすれば何語でどのようなものか
- 使用目的/LINEスタンプ、ロゴ、サムネイルなど、どのような目的で利用するか
- 人物描写/女性か男性か、どのような服装か、どのような髪型か、など
- 背景描写/背景には何があるか、天候は何であるか、など
- アングル/一人称視点なのか、三人称視点なのか、など
このようにこと細かく内容を指定することで、思ったとおりの出力結果を得られます。実際に使ってみると、その使い勝手のよさがよくわかるでしょう。
まずはいろいろな指定を出して、遊びながら感覚を掴むのがおすすめです。
料金は月額20ドル
DALL-E3を使うにはサブスクリプションChatGPT Plusを利用する必要があります。月額20ドル(約3,000円)で、これ以外の費用はかかりません。
DALL-E3だけを利用するプランなどはありません。
なおChatGPT Plusに登録すると使えるGPT-4は、無料版に当たるGPT-3.5と比べて回答の精度が高く、画像入力機能なども備えていますよ。
DALL-E3のみならず、GPT-4もフル活用すると、コスパがよくなるでしょう。
Bingなら無料だが商用利用不可
ただしDALL-E3にはBing版があり、これは無料で利用可能です。
いきなり20ドルを支払いたくない場合は、こちらでクオリティを試しましょう。
【補足】注意点は利用制限回数と描写能力の限界
上述したとおり、DALL-E3は、高性能かつ使いやすいツールです。しかし、利用制限回数と描写能力の限界がある点に注意してください。
DALL-E3を提供するChatGPT Plus自体が、3時間に50メッセージ以上送信されると一時的に利用制限される仕様になっています。
したがって大量の画像を出力することには向いていないといえるでしょう。
また描写能力の限界がある点にも注意してください。
サイズにもよりますが、一度の出力には数十秒の時間がかかります。また、すべてのオーダーに対して応えられるわけではありません。
能力の限界を超えたオーダーは、上図のように拒否されることがあります。
あらゆる指定に応えられるDALL-E3ですが、それでも限界がある点には注意しましょう。
DALL-E3の基本的な使い方
DALL-E3の使い方は簡単。以下5ステップですぐに使えますよ。
- ChatGPTログイン/新規登録する
- ChatGPT Plusに登録する
- 出力内容を設定する
- プロンプトを入力する
- 画像を微調整する
1.ChatGPTにログイン/新規登録する
まずはChatGPT Plusに登録しましょう。ここからトップページにジャンプしてください。
まず、上図青枠内からLog inを選択しましょう。まだアカウントを持っていないなら、Sign upを選択して新規登録します。
2.ChatGPT Plusに登録する
トップページにアクセスできたら、画面左下にあるUpgrade planを選択します。
以下のポップアップウィンドウが表示されます。右側にあるUpglade to Plusを選択しましょう。
決済画面に移動します。
カード情報などを入力し、申し込みを完了しましょう。
3.出力内容を設定する
上記までで、ChatGPT PlusおよびDALL-E3が使える状態になりました。続いて、チャット画面を開きます。
画面左下のチャットボックスに、DALL-E3と入力しましょう。
これでDALL-E3を利用する準備が整いました。
4.プロンプトを入力する
続いてプロンプトを入力しましょう。色々な入力方法がありますが、基本的には書いて欲しい内容を箇条書きするのがよいでしょう。
ここでは上図のようなプロンプトを入力します。しばらく待っていると、画像が出力されます。
カーソルを合わせるとすると、ダウンロードアイコンなどが表示されます。これをクリックすればダウンロード可能。
なおロングスカートと和服を取り違えている部分はありますが、この程度であれば、追加で修正を求めれば改善できるでしょう。
DALL-E3はあらゆる要求に応えますが、プロンプトから以下の要素を察知した場合、出力を拒否します。
- 暴力的である
- 性的である
- すでに著作権が誰かに帰属している
たとえばアーニャ・フォージャーのイラストを描いて欲しいと伝えても、下図のように回答されます。
5.画像を微調整する
出力された画像に過不足があるなら、再度プロンプトを入力しましょう。
上記のように要望を反映した画像が出力されます。
ここまでがDALL-E3の基本的な使い方です。
DALL-E3をより高度に活用するテクニック
DALL-E3は、ただチャットを送信するだけでも十分に使えるツールです。しかし、工夫しだいではさらに便利に活用できます。
特に以下のテクニックを覚えておけば、より便利になるでしょう。
- ピンポイントで修正を実施する
- 出力する枚数を指定する
- 英語でプロンプトを入力してより正確な出力を得る
- 何に使うのか詳細に説明する
- 参考画像を入力する
最低でも1から3はおさえておきたいところです。それぞれ詳しく解説するので参考にしてください。
1.ピンポイントで修正を実施する
DALL-E3は、ピンポイントでの修正に対応するのが得意。たとえば、「服の色を変える」「髪型を変える」といったことにも的確に対応できます。
たとえば、メガネをかけた男性を出力し、そのあとで洋服の色を変えたいとしましょう。
ここで、画像に割り当てられているシリアルナンバーに当たるSeed値を要求します。
そうすると、多少アングルは変わっているものの、服装の変更が反映された状態で類似した画像が出力されます。
うまくSeed値を使って、思ったとおりの画像を出力しましょう。
2.出力する枚数を指定する
DALL-E3では、出力する画像の枚数を指定することも可能です。やり方は簡単で、「〇枚描いてください」と伝えるだけ。
このように、テイストが違う画像を複数枚出力できます。なお、「1枚目はアニメ調、2枚目はポップ」といった形で、それぞれのテイストを指定することも可能です。
複数枚出力した場合は、「1枚目のイラストをもっとポップに」といった、出力の順番を指定した指示も出せるようになります。
3.英語でプロンプトを入力してより正確な出力を得る
また、英語でプロンプトを入力するテクニックもあります。これだけで、より要求どおりの出力を得ることが可能。
といっても、英文を書く必要はありません。日本語でプロンプトを入力したあとで、「このプロンプトは英語として認識してください」と入力するだけです。
もしくはGoogle翻訳で英訳したものをペーストしてもOK。
ただし英語にしたからといって、かならず出力内容が向上するとは限りません。日本語で入力したほうが好ましい結果になることもあるので、注意してくださいね。
4.何に使うのか詳細に説明する
何に使うのか詳細に説明するのも有効です。
DALL-E3は、単なるイラストだけなく、さまざまな趣旨の画像を出力できます。何に使うのかはっきり伝えれば、そのとおりの結果を得ることが可能。
- ロゴ
- サムネイル
- iPhoneの壁紙
- LINEスタンプ
- ゲームに使うドットイラスト
これ以外にも、ありとあらゆる用途に対応して出力ができます。一例として、ロゴを出力してみましょう。
このように航空会社らしいロゴが出力されました。
「垂直尾翼に描かれた」というのを、「垂直尾翼『が』描かれた」と取り違えているようにも見えますが、この程度の食い違いであれば簡単に修正可能。大きな問題にはならないでしょう。
他にもさまざまな用途での出力が可能
上述ではロゴを出力しましたが、他の趣旨ではどの程度の画像を描写できるのかチェックしてみましょう。
まず、「テニスに取り組む女の子を、LINEスタンプ風に出力して」と指示します。
このようにLINEスタンプとして活用するには十分な出力が得られました。
LINEでは一般ユーザーが有料でスタンプを販売可能。つまりDALL-E3ひとつで、スタンプ販売をビジネスにできるかもしれません。
次は「ギタリストをパワプロ(二等身キャラによる野球ゲーム)風に描いて」と指示します。以下のように出力されました。
ここでDALL-E3のやや不器用な部分が見えました。おそらく「パワプロ風」というのを、「パワーパフガールズ風」と誤解しています。
このように間違った出力をしてしまうときがあるので、やはりプロンプトを英語にしたり、後述するように参考画像を提示したりして補助するのがよいでしょう。
いかにDALL-E3とのコミュニケーションをスムーズにするかがポイントです。
5.参考画像を入力する
参考画像を入力すると、より正確な出力を得られます。
やり方は簡単で、参考にさせたい画像をチャットボックスにドロップするだけです。そして「これに近い画像を一枚描いて」などと指示すれば、そのように出力されます。
状況によっては微修正が必要ですが、それなりに近い画像が出力されました。
参考画像を利用するメリットは、写実的な画像を出力しやすい点。
DALL-E3は、文字によるプロンプトだけでは、リアリティある画像を描写しきれない部分があります。しかし参考画像があれば、それをそのまま模写するだけに近いので、問題なくリアルな出力ができるわけですね。
写実的な出力が欲しいときは、できるだけ参考画像を活用しましょう。
DALL-E3に関するよくある質問
本記事ではDALL-E3に関して詳しく解説しました。ここではよくある質問に回答します。
- 入力どおりに画像が生成できない場合は?
- 生成した画像の著作権は誰に帰属するか?
- スマホでも利用できる?
- 入力どおりに画像が生成できない場合は?
-
入力どおりに画像を生成できない場合は、プロンプトが複雑すぎるのかも知れません。少しシンプルな内容を要求してみましょう。
画像そのものが生成できない場合は、ChatGPT Plusの利用制限(3時間あたり50通)に引っかかっている可能性があります。
もしくは一時的なエラーが生じているかも知れません。その場合はリロードなどで改善する可能性があります。
ChatGPTは、それなりの頻度でエラーを起こします。何かあればリロードするという考えを持っておくとよいでしょう。
- 生成した画像の著作権は誰に帰属するか?
-
OpenAIのポリシーを参照する限り、ChatGPT Plus使って生成した画像の著作権はユーザーに帰属すると考えて問題なさそうです。
- スマホでも利用できる?
-
Chat GPTは、スマートフォンでも利用できます。
ただしChatGPT Plusの登録が必要なのは変わりません。
ChatGPTのスマホアプリの使い方|日本語化設定方法や無料で使う方法を解説 | meta land 2023年5月26日にChatGPTのiOS版のアプリが日本でリリースされました。本記事ではiPhoneユーザーにはアプリの使い方、AndroidユーザーにはスマホのブラウザでChatGPTを利用…
まとめ
本記事ではDALL-E3に関して解説しました。最後に重要なポイントを解説します。
- DALL-E3はOpenAIがリリースした画像生成AIサービス
- 出力される画像のクオリティは非常に高い
- 出力内容も細かく設定できる
- 運用にかかる費用は月額20ドル
- 英語のプロンプトを入力するとさらに出力の結果が向上する
- 参考画像を与えることでも、より的確な出力が得られる
AI分野で世界を牽引するOpenAIが作っただけあり、DALL-E3の精度はかなり高水準。画像生成AIサービスを探しているなら、DALL-E3は有力な選択肢になるでしょう。
月額20ドルかかりますが、Bing版なら無料で試せます。まずはそちらでテストしてみるのもよいでしょう。DALL-E3