Cottage of Content
© Copyright Oliver Dixon and licensed for reuse under this Creative Commons Licence.
前回は、ChatGPTにDALL-E3の使い方を尋ね、代表的な使い方を試してみるとともに、画像生成用のプロンプトの作り方を整理しました。
いろいろ試した中で、ChatGPT自体がDALL-E3の生成した画像をコンテンツポリシーに反するとして表示しないケースや、ChatGPTからの指示に対して、DALL-E3のコンテンツポリシーに反するとして、DALL-E3が画像を生成しないケースもあることが分かりましたので、本日は、ChatGPTとDALL-E3のコンテンツポリシーを確認しようと思います。
では、始めます。
私#1:
デフォルメした人物像の絵から、元の人物像に近いものに戻すことはできるでしょうか?
ChatGPT#1:
DALL-E3は、与えられたプロンプトや指示に基づいて新しい画像を生成する能力を持っていますが、デフォルメされた画像から元の詳細な人物像を完璧に復元することは非常に難しいです。
デフォルメされた画像には、元の顔の詳細な情報が失われている場合が多く、その失われた情報を正確に復元することは困難です。しかし、デフォルメされた画像をベースに、それに近い「通常の」人物像を生成することは可能です。
例えば、カートゥーン風の人物像を与えれば、それを元に「リアルな」外見の人物像を生成するように指示することができます。ただし、完全に元の人物の外見を再現することはできないかもしれません。
具体的なデフォルメされた画像や、どのような結果を望んでいるのかを教えていただければ、それに合わせて試してみることができます。
私#2:
有名なピカソの「泣く女」から、元の顔らしきものを作れるでしょうか?
ChatGPT#2:
ピカソの「泣く女」は、非常に特徴的なキュビズムのスタイルで描かれており、そのデフォルメされた特徴を「通常の」顔に戻すのは非常に難しいです。しかしながら、DALL-E3を使用して、その画像を元に「リアルな」外見の女性の顔を生成するような指示を出すことはできます。
ただし、元のモデルや人物の詳細を完璧に復元することはできませんが、泣く女の特徴や雰囲気を持つリアルな女性の顔を生成することは試みることができます。
なお、具体的にピカソの作品のスタイルを直接参照することは避けますが、そのスタイルの特徴や雰囲気をキャッチして、新しい画像を生成する指示をDALL-E3に出すことは可能です。
私#3:
では、その画像を生成するようDALL-E3に指示を出してください。
ChatGPT#3:
DALL·E 3
画像作成中にエラーが発生しました
申し訳ございませんが、今回のリクエストは私たちのコンテンツポリシーに従っていないため、画像を生成することができませんでした。他の要求や異なるアプローチでのリクエストには対応可能ですので、何か他の要望があればお知らせください。
私#4:
「今回のリクエストは私たちのコンテンツポリシーに従っていない」というのは、DALL-E3側のコンテンツポリシーに従っていないということでしょうか?それとも、ChatGPT側でしょうか?
ChatGPT#4:
申し訳ございません。今回のリクエストが私たちのコンテンツポリシーに従っていないのは、DALL-E3の側の制約によるものです。具体的には、直近100年以内に制作された芸術家のスタイルを直接参照することは避ける必要があります。再度、異なるアプローチや内容でのリクエストには対応可能ですので、何か他の要望や質問があればお知らせください。
私#5:
なるほど、1923年以前に制作されたものでないとだめなんですね。当時は、キュビズム風の絵はまだなかったでしたっけ?
ChatGPT#5:
1923年以前にもキュビズムは存在していました。キュビズムは、主に20世紀初頭にピカソとジョルジュ・ブラックを中心に発展しました。1907年のピカソの「アヴィニョンの娘たち」は、キュビズムの初期の代表的な作品として知られています。そのため、1923年以前のキュビズムのスタイルや特徴を参考にすることは可能です。
ただ、特定の芸術家や具体的な作品名を直接参照することは避ける必要がありますが、その時代の一般的なキュビズムの特徴やスタイルを指示として使用することは問題ありません。
私#6:
なるほど。では、「アヴィニョンの娘たち」の絵から、元の娘たちの顔に近い絵を生成してもらえますか?
ChatGPT#6:
申し訳ございませんが、「アヴィニョンの娘たち」のような具体的な作品名を直接参照しての画像生成は、私たちのポリシーに基づき行うことができません。
しかし、キュビズムの特徴やその時代の一般的なスタイルをもとに、抽象的な女性の顔をより写実的に描かれた絵を生成することは可能です。具体的な作品名を参照しない形でのリクエストであれば、対応可能ですので、そのようなアプローチで進めることをご希望であればお知らせください。
私#7:
そうでしたね。今から100年以上前の絵でも、有名な画家の絵を基にした画像生成はコンテンツポリシーに反するということですね?
ChatGPT#7:
はい、正確には、特定の芸術家やその具体的な作品を直接参照することは避ける必要があります。しかし、100年以上前の一般的な芸術的スタイルや運動(たとえばキュビズムや印象派など)を参考にすること自体は問題ありません。具体的な作品や芸術家の名前を直接指定するのではなく、その時代やスタイルの特徴を基にした画像生成をリクエストすることは可能です。
私#8:
今やろうとしているのは、キュビズムの絵を生成するのではなく、過去のキュビズムの絵から、その絵のモデルとなった人物の実物に近い絵を生成できないかということです。
ChatGPT#8:
理解しました。そのアプローチであれば、キュビズムの絵の特徴をもとに、モデルとなったと考えられる人物の実物に近い絵を生成する試みは行うことができます。具体的な作品や芸術家の名前を直接参照することなく、キュビズムの一般的な特徴やスタイルを基にしたリクエストとして進めることが可能です。
「キュビズムの特徴を持つ女性のポートレートをもとに、その女性の実物に近い写実的な絵を生成してください」という形でのリクエストであれば、対応することができます。
私#9:
了解です。では、お任せしますので、シーン1として、キュビズムの特徴を持つ女性のポートレートを作っていただき、シーン2,シーン3、シーン4と行くにつれて次第に実物の女性の顔に近づくように4つの絵を生成してください。
ChatGPT#9:
DALL·E 3
作成された 4 枚の画像
以上の画像は、キュビズムの特徴を持つ女性のポートレートから、実物の女性の顔に近づく過程を表現しています。左から順に、キュビズムの影響が強く、次第に実物に近づく過程を描いています。どの画像がお気に入りですか?
私#10:
だいたい感じはわかりました。次に、ピカソの「泣く女」の絵に似た、キュビズム+アブストラクト風の女性の顔の絵を生成してみてください。
ChatGPT#10:
DALL·E 3
画像作成中にエラーが発生しました
申し訳ございませんが、今回のリクエストは私たちのコンテンツポリシーに従っていないため、画像を生成することができませんでした。何か他のリクエストがあればお知らせください。
私#11:
『ピカソの「泣く女」の絵に似た』ものをリクエストするのがコンテンツポリシーに反するのでしょうか?それとも「ピカソ」の名前を出す時点でコンテンツポリシーに反するのでしょうか?
ChatGPT#11:
申し訳ございません。おっしゃるとおり、具体的なアーティスト名やその作品を直接参照することが問題となります。具体的なアーティスト名を使用せず、スタイルや特徴を説明する形でのリクエストであれば、対応することができるかと思います。例えば、「キュビズムとアブストラクトを組み合わせた女性の顔の絵」のような形でのリクエストは可能です。再度、ご要望をお知らせいただければと思います。
私#12:
わかりました。では、絵の生成をリトライする前に、OpenAIが、ChatGPTやDALL-E3のコンテンツポリシーを説明している資料があれば、そのURLを教えてください。
ChatGPT#12:
申し訳ございませんが、直接的な外部リンクの提供はサポートしておりません。しかし、OpenAIの公式ドキュメントや関連情報は、OpenAIの公式ウェブサイトにアクセスすることで閲覧することができます。ウェブブラウザなどで「OpenAI」と検索すれば、公式サイトへのリンクが見つかるはずです。公式サイト内には、モデルやプロジェクトに関する詳細、ガイドライン、ポリシーなどの情報が掲載されています。
私#13:Bingに同じ質問をしたところ、以下の回答がありました。
OpenAIのChatGPTとDALL-E3のコンテンツポリシーについては、以下のリンクをご覧ください。 4) Content policy | DALL·E – OpenAI Labs これらのページには、OpenAIのAIツールの使用に関するガイドラインとポリシーが詳細に説明されています。1234 また、具体的な使用例やアップデート情報も提供されています。23 これらの情報を参考にしていただくことで、OpenAIのChatGPTとDALL-E3を安全かつ効果的にご利用いただけることと思います。 |
このうち、1)、2)、3)のリンクを表示してもコンテンツポリシーは見つかりませんでしたが、4)は確かにDALL-Eのコンテンツポリシーが説明されていました。
このURL(https://help.openai.com/en/collections/3643409-dall-e-content-policy)が、そのDALL-EのコンテンツポリシーのページのURLなので、重要な点をすべておさえて、内容を詳しく要約してもらえるでしょうか?
ChatGPT#13:
申し訳ございませんが、私のトレーニングデータには2022年1月までの情報しか含まれておらず、指定されたURLの具体的な内容を直接閲覧することはできません。
ただし、OpenAIの公式ドキュメントやガイドラインの主要なポイントについては、一般的な情報を提供することができます。特定の内容や最新の変更に関しては、直接URLを閲覧することをおすすめします。
もし、特定のトピックやキーワードに関する情報が必要であれば、それに関する質問をしていただければと思います。
#今回、DALL-E3を使うために、ChatGPT Plusをプラグインオプションではなく、「Default」オプションで使っているため、WebPilot等のプラグインが使えません。すべてがβ版の機能ではなく、通常機能になれば両方同時に使えるのでしょうが、現時点ではプラグインを使いたい場合はDALL-E3が使えず、DALL-E3が使いたい場合はプラグインが使えません。
そこで、ChatGPTをWebpilotのプラグインを利用するモードに切り替え、以下のプロンプトを実行しました。
私#14:
次のURLは、DALL-Eのコンテンツポリシーです。重要な点をすべておさえて、内容を詳しく要約してもらえるでしょうか?
https://help.openai.com/en/collections/3643409-dall-e-content-policy
ChatGPT#14(with Webpilotプラグイン):
申し訳ありませんが、指定されたURLからDALL-Eのコンテンツポリシーに関する詳細な情報を取得することができませんでした。ページには関連するFAQやその他のリンクがありましたが、具体的なポリシーの内容は表示されていませんでした。
もし他に何かお手伝いできることがあれば、どうぞお知らせください。
#同じプロンプトをBingに渡すと、DALL-Eのコンテンツポリシーの説明を一旦始めたのですが、突如、説明しかけていた内容をすべて消し、以下の回答が返されました。
Bing:
間違えました、すみません。それについては回答を出すことができません。違う話題にしましょう。 |
#このBingの振舞は、一旦Bingとしては回答しかけたけれどもOpenAIから回答を拒否するように指示された感じがしました。
#そこで、同じプロンプトをGoogle Bardにも投げかけてみました。
Bard:
はい、DALL-Eのコンテンツポリシーの重要な点をまとめます。 DALL-Eは、テキストと画像のデータセットでトレーニングされた大規模な言語モデルです。テキストの説明に基づいて、画像を生成することができます。DALL-Eのコンテンツポリシーは、ユーザーがDALL-Eを使用して生成できる画像の種類を制限しています。 ポリシーの重要な点は以下のとおりです。
これらのポリシーに違反する画像を生成した場合、DALL-Eは画像の生成を拒否します。また、OpenAIは、ユーザーをアカウント停止などの措置を講じる場合があります。
さらに、DALL-Eは、ユーザーが生成した画像を保存したり、共有したりすることを許可していません。ユーザーは、生成した画像を自分の個人的な使用にのみ使用することができます。 #ここの文言については旧DALL-E版に関するコンテンツポリシーで、生成した画像の所有権は、DALL-E2同様にユーザーにあり、転載、販売、商品化にOpenAIの許可は不要ということのようです。 出典:IT Media News 「OpenAIの文→画像AI「DALL・E 3」、10月にChatGPT PlusとAPIで利用可能に」
DALL-Eは、まだ開発中のツールです。OpenAIは、ポリシーを常に改善し、ユーザーがDALL-Eを安全かつ責任を持って使用できるように取り組んでいます。 以下に、ポリシーの具体的な例をいくつか示します。
- 人種差別的な画像 - 宗教差別的な画像 - 性差別的な画像 - 性的指向に基づく差別的な画像 - 障害に基づく差別的な画像
- 武器や爆発物を使った画像 - 暴力的な行為を描いた画像 - 自殺を助長する画像
- 薬物やアルコールの使用を描いた画像 - ギャンブルを描いた画像 - 違法行為を描いた画像
- 商標やロゴが含まれる画像 - 有名人の肖像権を侵害する画像
- 他人を傷つける画像 - DALL-Eを不正に使用する画像 DALL-Eを使用することで、創造的な画像を生成することができます。しかし、ポリシーを遵守することで、安全かつ責任を持ってDALL-Eを使用することが重要です。 |
#このBardのDALL-Eのコンテンツポリシーの説明に関して、ChatGPT(Defaultオプション)に内容を吟味してもらったところ、以下の回答を得ました。
私#15:
Google BardがDALL-E Content Policyに基づいて、以下の説明をしていますが、正しくない表現があれば指摘して下さい。
<以下、Google BardのDALL-Eコンテンツポリシーの解説>
ChatGPT#15:
Google Bardが示したDALL-Eのコンテンツポリシーの説明は、一般的な内容については正確に説明していますが、以下の点について補足や訂正が必要です:
1.保存や共有の制限:
Google Bardが述べているように、「DALL-Eは、ユーザーが生成した画像を保存したり、共有したりすることを許可していません」という情報は正確ではありません。DALL-Eを通じて生成された画像は、特定の使用条件下で保存や共有することが可能です。
2.開発中のツール:
「DALL-Eは、まだ開発中のツールです」という記述も正確ではありません。DALL-Eはすでに公開され、多くのユーザーに利用されているツールです。ただし、OpenAIは常にツールの改善やアップデートを行っています。
3.アカウント停止:
「OpenAIは、ユーザーをアカウント停止などの措置を講じる場合があります」という記述は一般的すぎます。具体的な違反の内容や頻度によって、OpenAIは適切な措置を取ることがあります。
上記の点を除けば、Google Bardが提供した内容はDALL-Eのコンテンツポリシーに基づいているようです。ただし、正確なポリシーや使用条件に関しては、OpenAIの公式サイトや公式ドキュメントを参照することをおすすめします。
#ということでした。これは、DALL-Eのコンテンツポリシーなので、次にChatGPT側のコンテンツポリシーを確認するため、OpenAIのUsage policiesからコンテンツポリシーに相当する部分を抜粋してもらうことにしました。
私#16:
下記URLはOpenAIのUsage policiesです。この中からChatGPTのコンテンツポリシーに相当するものを抜粋して日本語表示してください。
Usage polici https://openai.com/policies/usage-policieses (openai.com)
ChatGPT#16:
もちろん、コンテンツポリシーに相当する部分を以下に抜粋します。
モデルの禁止された使用
- 違法行為:OpenAIは、違法行為に対して私たちのモデル、ツール、サービスの使用を禁止しています。
- 児童性的搾取素材または子供に対する搾取または害を与えるコンテンツ:私たちはCSAM(児童性的搾取素材)を失踪および搾取児童センターに報告します。
- 憎悪、嫌がらせ、または暴力的なコンテンツ:身元に基づいて憎悪を表現、扇動、または促進するコンテンツ。
- 個々の人々を嫌がらせ、脅迫、またはいじめることを意図したコンテンツ。
- 暴力を促進または賛美する、または他人の苦しみや屈辱を祝うコンテンツ。
- マルウェアの生成:コンピュータシステムに対して妨害、損傷、または無許可でアクセスを試みるように設計されたコードを生成しようとするコンテンツ。
アダルトコンテンツ、アダルト産業、およびデートアプリ
- 性的興奮を引き起こすような内容(例:性的行為の説明)、または性的サービスを促進する内容(性教育およびウェルネスを除く)
- エロチックチャット
- ポルノグラフィ
これらがOpenAIの使用ポリシーにおけるコンテンツに関する主要な制限とガイドラインです。何か他に質問があれば、どうぞお知らせください。
以上、今回は、ChatGPTとDALL-E3のコンテンツポリシーについて確認しました。
せっかくChatGPTからDALL-E3が使えるようになったのに、ほとんど文字ばかりの内容になってしまいましたので、以下は、おまけとして、DALL-E3を使って「アルチンボルドの肖像画のスタイル:コンポジットヘッド」を生成してみましたので、ご覧ください。
#「アルチンボルドの肖像画のスタイル:コンポジットヘッド」といってもピンとこないでしょうが、以下の生成された画像をご覧いただければ、すぐわかるはずです。
私#17:
Create a painting that, at first glance, appears to be a still life of various objects or a scene from nature. However, the arrangement of the objects should cleverly form the likeness of a human face. The use of shadows, colors, and object placement should be meticulous, ensuring that both the still life and the hidden face are visually coherent and striking. Taking inspiration from the provided image, consider using vegetables, fruits, or other natural elements as your primary objects, but feel free to incorporate any items that fit the theme and aid in the illusion.
ChatGPT#17:
DALL·E 3
作成された 4 枚の画像
Here are the generated images based on your description. Each image presents a scene or arrangement that reveals the likeness of a human face. Let me know if any of them align with what you had in mind!
私#18:
今度は、食べ物やキッチン用品ではなく、大工道具、工作道具、塗装道具などを使って人の顔のように見える絵を作ってみてください。
ChatGPT#18:
DALL·E 3
作成された 4 枚の画像
大工道具、工作道具、塗装道具を使って、人の顔のように見える絵を生成しました。それぞれの絵をご確認いただき、感想やさらなる要望があればお知らせください。
私#19:
今度は、化粧品や化粧道具を使って女性の顔に見える絵を作ってみてください。
ChatGPT#19:
DALL·E 3
作成された 4 枚の画像
化粧品や化粧道具を使って、女性の顔のように見える絵を生成しました。それぞれの絵をご確認いただき、感想やさらなる要望があればお知らせください。
私#20:
元の、野菜、果物、キッチン用品を使って、いろいろな動物の顔に見える絵を作ってください。
ChatGPT#20:
DALL·E 3
作成された 4 枚の画像
野菜、果物、キッチン用品を使って、いろいろな動物の顔のように見える絵を生成しました。それぞれの絵をご確認いただき、感想やさらなる要望があればお知らせください。
私#21:
いいですね。鳥とか魚はどうでしょうか?
ChatGPT#21:
DALL·E 3
作成された 4 枚の画像
鳥や魚の顔をテーマにして、野菜、果物、キッチン用品を使った絵を生成しました。それぞれの絵をご確認いただき、感想やさらなる要望をお知らせください。
この一連の「コンポジットヘッド」は、以下の手順で作成しました。
- ジュゼッペ・アルチンボルドのだまし絵に対して、
- 【ChatGPT】GPT-4Vを利用したプロンプトの作成方法としてジコログに掲載されていた内容を参考に「プロンプトガイド」を作成し、
- ChatGPTのGPT-4Vに、そのプロンプトガイドをしっかりと理解するように指示した後、
- 上記のだまし絵をアップロードして、「プロンプトガイドに従って、その画像のプロンプトを英語で出力してください」と指示。
- そのGPT-4Vからの出力結果を私#17では、ChatGPTのDefault(DALL-E3呼び出しモード)のプロンプトとして指示。
その結果がChatGPT#17のDALL-E3の出力となっています。
4番目のステップで、実に詳細な英文でのプロンプトでの指示ができ上がるので、⑤のステップでは、いとも簡単に同じようなだまし絵が出来上がりました。
本日は以上です。
終わり