2023年10月5日にChatGPTで画像生成機能「DALL·E3(DALLE3)」が日本でも使えるようになりました。
ChatGPTで使えるようになったことは把握しているものの、DALL·E3でできることや使い方を知らない方もいるのではないでしょうか。
そこで、本記事では「DALL·E3」の特徴や使い方、ChatGPTでDALL·E3を使う場合の具体的な活用事例を解説します。
最後に紹介するDALL·E3を使う際のよくある質問も参考にしてみてください。
画像生成AI「DALL·E3(DALLE3)」とは
DALL·E3は2023年9月21日にOpenAI社が公開した最新画像生成AIで、テキストから画像を生成が可能です。
ChatGPTの有料プランを契約しているユーザーであれば、順次、DALL·E3が利用できるようになっています。
また、Microsoft Bingの「Image Creator」であれば、無料でDALL·E3が使用できます。
DALL·E3(DALLE3)の特徴
DALL·E3の特徴は、以下3つです。
それぞれの特徴を見ていきましょう。
特徴1:ChatGPTと統合して画像生成が可能
ChatGPT上でDALL·E3を用いると、画像生成によるアイデアの具体化や、画像のブラッシュアップが可能です。
例えば、ある画像で物足りない箇所がある場合、ChatGPTでプロンプトを入力することで画像調整の依頼が可能です。従来であれば、自分たちで調整する手間がかかっていましたが、ChatGPTとDALL·E3が統合したことで作業の効率化を図れるようになりました。
また、DALL·E3で生成した画像は、ユーザーが自分のものとして、自由に使用・販売、商品利用が可能です。
特徴2:より緻密な画像生成が可能
DALL·E3は、従来のモデルと比較すると文章を読み取って画像を生成する機能が向上しているのが特徴です。
例えば、DALL·E3に「犬が庭の周りを走っている画像を生成してください」と指示したとします。
その場合、指示内容を読み取るのはもちろん、犬がいる背景や庭の情景などをさらに詳しく描いて画像生成してくれます。
また、生成する画像の出力枚数を指定したり、生成する画像に文字を入れたりなど、できることの幅が広がっています。
特徴3:安全性を考慮したコンテンツ生成が可能
DALL·E3では、安全性を考慮したコンテンツ生成が可能です。
以下のような有害だと想定される画像生成は制限されています。
また、著作権侵害対策やフェイクニュースでの悪用防止のために、特定の公人や著名人、存命アーティストなどの名前を含んだ画像生成のリクエストは拒否されるように設計されています。
DALL·E3(DALLE3)の基本的な使い方
ここからは、DALL·E3で画像生成する基本的な使い方を以下2パターンに分けて解説します。
それぞれの場合を見ていきましょう。
使い方1:ChatGPTの場合(有料)
ChatGPTでDALL·E3を用いる場合、有料プラン契約をしていれば、以下の手順で使用できるようになります。
ChatGPTにログイン後、左上の「DALL·E3」タブを選ぶ。
プロンプト入力画面で、画像生成のプロンプトを入力する。
確定ボタンを押すと画像生成が始まる。
使い方2:Microsoft Bing Image Creatorの場合(無料)
Microsoft Bing Image Creatorでは、無料でDALL·E3が使用可能です。
手順は以下のとおりです。
「Image Creator」にアクセスする。
作成する画像の説明欄に、プロンプトを入力する。
「参加して作成」をクリックすると画像生成が始まる。
前提:プロンプトは「PromptSimple」で作成する
Custom Instructionsの使い方を紹介する前に、前提としてプロンプトの書き方を統一させてください。
本記事ではBotCampで推奨している、ChatGPTプロンプトテンプレート「Prompt Simple」を使用することを前提に説明します。
「Prompt Simple」とはDIK独自の書き方で、以下5項目を含むプロンプトのことを指します。
#お願い
「#お願い」に何を書く?
・5W1Hを意識して明確に具体的に作業をお願いする。
・仕事全体のうちの、どの役割を頼むのかを明確に伝える
#目的
「#目的」に何を書く?
・なぜその仕事をお願いしているのかの目的と背景を伝える
#情報
「#情報」に何を書く?
・自分とChatGPTの情報格差を無くし、前提知識を揃えるための参考情報を提供する
#ルール
「#ルール」に何を書く?
・クオリティとして担保したいこと、アウトプットとして期待していることを明確に伝える
#出力
「#出力」に何を書く?
・アウトプットイメージを伝える(表形式、ブレッド形式など)
ChatGPT「DALL·E3(DALLE3)」の活用事例
ここからは、ChatGPTでDALL·E3を使う場合の活用事例、以下2パターンをご紹介します。
それぞれ見ていきましょう。
活用事例1:画像生成
ChatGPT新機能DALL·E3を使って、年賀状の挿絵画像を生成してみましょう。
ビジネス用の年賀状の挿絵画像を生成する事例
プロンプト内容に従って、蛇の画像が生成されました。
活用事例2:生成した画像のブラッシュアップ
ここからは、さきほど生成した画像をブラッシュアップする例を見ていきましょう。
年賀状用に生成した画像のイメージを変更する事例
プロンプト内容に従って、可愛らしい蛇の画像が生成されました。
年賀状用に生成した画像のイメージをシンプルにする事例
入力した指示内容に従って、シンプルな蛇の画像が生成されました。
年賀状用に生成した画像に文字を入れる事例
含めるよう指示した文字「賀正」は入っていないものの、指示した数字「2025」が記載された画像になりました。
年賀状用に生成した画像の背景を変更する事例
プロンプトに沿って、背景が変更された画像になりました。今回は、一つ前に指示した文字が消えています。そのまま入れておきたい文字がある場合は、あらかじめ指示しておく必要があるでしょう。
このように、指示を与えることで生成した画像はブラッシュアップが可能です。
活用事例3:生成した画像の部分修正
DALL·E3に部分修正機能が追加されました。(2024年4月4日現在)
ブラシで修正したい箇所を指定すると、指定した箇所にのみ変更を加えることが可能です。
ここからは、生成した画像を部分修正する例を見ていきましょう。
企業のイメージ用に生成した画像のイメージを部分修正する事例
生成した画像を選択し、右上に表示されるブラシマークを選択します。
修正したい箇所をマウスでドラッグし、選んでください。
修正したい箇所を選択できたら、右下に表示されている入力画面に変更内容を入力します。
今回は、選択した箇所の「人数を減らしてください。」と指示してみました。
指示した内容に沿って修正され、再度画像が生成されました。
画像生成AI「DALL·E3(DALLE3)」を使う際のよくある質問
画像生成時に便利なDALL·E3(DALLE3)ですが、使う際によくある質問を以下4つ紹介します。
それぞれ詳しく見ていきましょう。
ChatGPTで生成できる画像サイズや種類は?
ChatGPTでDALL·E3を使って生成できる画像サイズは、以下3種類から選択可能です。
サイズを指定する場合は、プロンプトで指示しましょう。
また、DALL·E3で生成できる画像の種類は、風景・生物・物体・イメージ図など多岐にわたります。
生成した画像を使う際の注意点は?
OpenAI社の公式サイトによると、DALL·E3で生成した画像はOpenAI社のライセンスに従って、人工知能が生成したことを明示する必要があります。
生成した画像を使用する際には、AIで生成したことを提示して使いましょう。
生成した画像の使用に制限はあるの?
DALL·E3は、フィルタリングシステムを導入しているため、有害な内容を含むプロンプトに対しては、画像生成ができません。
有害だと想定される内容は、主に以下5つです。
フィルタリングシステムは、有害な内容を含むプロンプトを発見するために導入されていますが、発展途上なシステムです。そのため、DALL·E3で意図しない画像が生成される場合があります。
不適切だと思われる画像が生成された際には、画像を削除しフィードバックを送るようにしましょう。
また、特定の公人や著名人の画像生成も、不適切な利用を防ぐために制限されています。
ChatGPT研修「BotCamp」の特徴
わたしたちが提供する「BotCamp」は、ChatGPT研修の使い方を初心者から学べる研修です。
・日々登場する新しいAIツールやGPTsに、インプットが追いつかない
・AIツールの選択肢が多すぎて、自分にとって最適なツールを見つけられない
・生成系AIが仕事にどう役立つのか、あまりイメージできない
・すでに業務にAIを取り入れているが、使い方が適切なのかわからない
・時間をかけて学習しても、投資対効果がよいのか分からない
・プロンプトエンジニアリングって難しそう。とっつきづらく感じている
このようなお悩みをお持ちの方におすすめです。
BotCampの特徴1:プロンプトを難しく考えずシンプルに捉える
生成AIからのアウトプットの質を高めるコツは、指示文を「端的に・具体的に」書くことです。
だらだらと長く書く必要はありません。プログラミングやシステムエンジニアリングのように、用語めいた難しい言葉を使う必要も一切ありません。
「プロンプトエンジニアリング」と聞くとやや学術的で高度な技術的理解が必要な印象を受けるかもしれませんが、Prompt Simpleという考え方で、誰でも最小限の労力で最大限AIパワーを活用する方法をお伝えします。
BotCampの特徴2:便利なGPTsを厳選して紹介
GPT storeにて日々増え続ける膨大なGPTsのうち、業務改革のインパクトが大きく重要なGPTsを厳選して紹介します。
業務の種類ごとに、どのGPTを使うべきか自分で考え判断できる応用力を身につけることができます。
BotCampの特徴3:Advanced Data Analysis(旧Code Interpreter)で「一億総データサイエンティスト」に
CSV、PDFなどのデータをアップロードした上で、ChatGPT上でPythonのコードを生成・実行できる機能「Advanced Data Analysis」を活用し、高度な専門性がなくても誰もがデータサイエンティストのようなモデル作成、データの予測ができるようになります。
BotCamp開催概要
開催日程 | 研修内容ページを確認 |
研修時間 | 9:00~17:00もしくは10:00-18:00 |
開催形式 | 対面のみ(オンライン参加不可) |
会場 | 水道橋開催の場合 コンフォート水道橋 東京都千代田区神田三崎町2-7-10 帝都三崎町ビル 2階,5階 https://www.relo-kaigi.jp/comfort-suidoubashi/access/ 神田開催の場合 BIRTH KANDA 東京都千代田区神田錦町1-17-1 神田髙木ビル7F https://birth-village.com/ |
備考 | ・ChatGPT(GPT-4)が入ったWindowsPCをお持ちください ・推奨のOSはWindowsです。Macでの受講はご遠慮ください。 ・セキュリティ上ChatGPTが使えないPCでの受講はご遠慮ください。 |