The Saddle Inn
© Copyright Gordon Hatton and licensed for reuse under this Creative Commons Licence.

 

しばらく前から、生成AI関連で「ディーファイ」という言葉を耳にするようになりました。

当初、DeFi(Decentralized Finance:分散型金融)にも生成AIが使われるようになった??と思ったのですが、Dify.AIのことだったんですね。

 

今日は、CopilotにDiFYについて教えてもらいたいと思います。

では、始めます。

 

私#1:

DefiとDiFY(DiFY.AI)は紛らわしいですが、それぞれについて説明してください。DiFY.AIはDefiアプリケーション構築用に考えられたのでしょうか?

Copilot#1

DefiとDiFY.AIは異なる概念で、それぞれについて説明します。

Defi: Defiは「Decentralized Finance」の略称で、日本語では「分散型金融」といいます。これはブロックチェーン上に構築された金融アプリケーションであり、スマートコントラクト技術が活用されています。Defiでは、銀行や証券会社など、従来の金融サービスのような中央管理者が存在しません。ユーザー同士の取引によって構成される分散的なシステムであることから、Defiは分散型金融と呼ばれます。

DiFY.AI: 一方、DiFY.AIは生成AIツールの開発プラットフォームです。単一のモデルを使うのではなく、複数のAIモデルやツールを組み合わせることで、特定のタスクに特化した高性能なAIアプリケーションを簡単に作ることができます。その最大の特徴は、RAG(Retrieval-Augmented Generation)エンジンを搭載していることです。

DefiとDiFY.AIは、それぞれ異なる目的と機能を持っています。Defiは分散型金融システムを提供するのに対し、DiFY.AIはAIアプリケーションの開発を支援します。したがって、DiFY.AIがDefiアプリケーション構築用に考えられたわけではありません。しかし、DiFY.AIを使用してDefiに関連するAIアプリケーションを開発することは可能です。

 

私#2

DefiとDiFYが、別ものであるということはわかったのですが、DiFY.AIのイメージがつかみにくいので、もう少しどんなものか具体的に説明してもらえますか?

Copilot#2

もちろんです。DiFY.AIは、AIモデルの開発と組み合わせを容易にするためのプラットフォームです。

具体的には、以下のような特徴があります:

1.     複数のAIモデルの組み合わせ:DiFY.AIは、単一のAIモデルだけでなく、複数のAIモデルを組み合わせて使用することができます。これにより、特定のタスクに最適なAIモデルの組み合わせを選択し、それらを一緒に動作させることが可能になります。

2.     RAG(Retrieval-Augmented Generation)エンジン:DiFY.AIの最大の特徴の一つは、RAGエンジンを搭載していることです。RAGエンジンは、情報を取得(Retrieval)し、それを基に新たな情報を生成(Generation)する能力を持っています。これにより、AIモデルは、既存の情報を基に新たな情報を生成することができます。

3.     AIアプリケーションの開発支援:DiFY.AIは、AIアプリケーションの開発を支援するためのツールを提供します。これにより、開発者は、AIモデルの選択、組み合わせ、チューニングなど、AIアプリケーションの開発に必要な作業を効率的に行うことができます。

これらの特徴により、DiFY.AIは、AIモデルの開発と組み合わせを容易にし、高性能なAIアプリケーションの開発を支援します。そのため、DiFY.AIは、AI開発者にとって非常に有用なツールとなります。ただし、DiFY.AI自体がDefiアプリケーションを構築するために設計されたわけではありません。それは、AIアプリケーション全般の開発を支援するためのものです。しかし、その中にはDefiに関連するAIアプリケーションも含まれます。このように、DiFY.AIは、AIアプリケーションの開発を容易にするための強力なツールとなります。それぞれのAIモデルが持つ強みを活かし、それらを組み合わせることで、より高性能なAIアプリケーションを開発することが可能になります。それがDiFY.AIの目指すところです。

 

私#3

CohereのCommand R+など、生成AI自体にRAGエンジンを持っているものもあると思いますが?

Copilot#3

その通りです。CohereのCommand R+など、一部の生成AIモデルはRAG(Retrieval-Augmented Generation)エンジンを内蔵しています。

**CohereのCommand R+**は、会話型インタラクションや長いコンテキストタスクに最適化された大規模言語モデルで、非常に高性能を目指しています。このモデルは、RAGエンジンを活用して、ユーザーの質問に対する回答を生成します。

RAGエンジンは、生成AIが質問に回答する際に、生成AIのデータベースに加え、膨大な自社のデータベースから情報を検索し、回答させるように自社データを組み込む手法のことを指します。これにより、生成AIから、社内データベースやWeb上の最新情報などの膨大なデータを反映した精度の高い回答を得ることができます。

したがって、CohereのCommand R+のようなRAGエンジンを内蔵した生成AIモデルは、ユーザーの質問に対してより詳細で正確な回答を提供することが可能です。ただし、DiFY.AIとCohereのCommand R+は異なる目的と機能を持っています。DiFY.AIはAIアプリケーションの開発を支援するプラットフォームであり、CohereのCommand R+は会話型AIモデルです。

 

私#4

Lang Chainとの違いを教えてください。

Copilot#4

Lang ChainとDiFY.AIは、どちらもAIアプリケーションの開発を支援するツールですが、それぞれに特徴と目的があります。

Lang Chain: Lang Chainは、大規模言語モデル(LLM)を用いたアプリケーション開発を効率的に行うためのライブラリです。Lang Chainは、モデルが生成する情報のカスタマイズ、正確性、関連性を向上させるためのツールと抽象化を提供します。開発者はLang Chainコンポーネントを使用して新しいプロンプトチェーンを構築したり、既存のテンプレートをカスタマイズしたりできます2。Lang Chainには、LLMが再トレーニングなしで新しいデータセットにアクセスできるようにするコンポーネントも含まれています。

DiFY.AI: 一方、DiFY.AIは生成AIツールの開発プラットフォームです。単一のモデルを使うのではなく、複数のAIモデルやツールを組み合わせることで、特定のタスクに特化した高性能なAIアプリケーションを簡単に作ることができます。その最大の特徴は、RAG(Retrieval-Augmented Generation)エンジンを搭載していることです。

Lang ChainとDiFY.AIの主な違いは、Lang ChainがLLMを用いたアプリケーション開発を効率的に行うためのライブラリであるのに対し、DiFY.AIは生成AIツールの開発プラットフォームであるという点です。また、DiFY.AIは直感的なUIで時間をかけずに生成AIアプリを構築することが可能で、Lang Chainよりも本番環境に適しているとされています。

 

私#5

Microsoftの製品群でいうと、Azureのクラウド環境+複数の生成AIアシスタント機能+Prompt Flowの開発・デバッグ・監視機能と機能的に同じと考えて良いですか?

Copilot#5

はい、その理解でほぼ正確です。ただし、それぞれの製品やサービスの詳細な機能や特性には違いがありますので、具体的に比較してみましょう。

Azureのクラウド環境: AzureはMicrosoftが提供するクラウドサービスで、サーバーやネットワークなどのITインフラをクラウド上で提供します。また、IoTやブロックチェーン、人工知能の機械学習、データ分析など、様々な開発業務をクラウド上で行うためのプラットフォームも提供しています。

生成AIアシスタント機能: 生成AIアシスタントは、ユーザーの指示に従い、特定のタスクを実行するアシスタントのような機能を持つAIのことです。生成AIアシスタントは、入力された音声をテキストに変換する音声認識機能を備えています。

Prompt Flowの開発・デバッグ・監視機能: Prompt Flowは、Azure Machine Learning(AzureML)の機能の一つで、プロンプトエンジニアリングプロジェクトの開発、評価、デプロイ等をワークフローに変えるツールです。開発が完了したら、Prompt Flowはワンクリックでデプロイし、テスト用のインタラクティブなGUIを提供します。さらに、評価指標、遅延、スループットなどの連続的な監視を提供し、アラートを提供して、フローを継続的に改善し、LLMアプリケーションのサービスレベル契約(SLA)を維持するのに役立ちます。

DiFY.AI: 一方、DiFY.AIは生成AIツールの開発プラットフォームです。単一のモデルを使うのではなく、複数のAIモデルやツールを組み合わせることで、特定のタスクに特化した高性能なAIアプリケーションを簡単に作ることができます。その最大の特徴は、RAG(Retrieval-Augmented Generation)エンジンを搭載していることです。

したがって、DiFY.AIはAzureのクラウド環境、生成AIアシスタント機能、Prompt Flowの開発・デバッグ・監視機能といった機能を統合したような存在と言えますが、それぞれの製品やサービスの詳細な機能や特性には違いがあります。

 

私#6

Difyの開発者/社と、DiFYを開発・影響するに至った経緯が分かれば教えてください。

Copilot#6

Dify.AIは、米国デラウェア州に登記上の事務所を置く企業であるLangGenius, Inc.によって開発・運営されています1。最高経営責任者(CEO)はLuyu Zhang氏です。

Dify.AIの開発に至った経緯については、以下のような背景があります:

AIと生成AIの複雑さ:AIや生成AIのような複雑な分野では、理論に深く潜り込む傾向があります。しかし、その理論を実プロジェクトに適用するときに真の価値が現れます。

生成AIの革命:生成AI、特にChatGPTのようなツールは、アイデアを現実に変えるプロセスを革命的に変えました。これらの複雑なAIモデルと簡単な言葉で対話することができます。

開発の困難さ:従来、AIにおける概念から実行までの道のりは困難で、何ヶ月/何年もかかり、イノベーションやAI技術の広範な普及への大きな障壁となっていました。

生成AIアプリの開発の課題:この巧妙に作られたプロンプトを実現可能な製品に変えることは簡単ではありません。多くの場合、単一のプロンプトでのタスク完了は難しく、複数の調整されたプロンプトが必要です。

これらの課題に対して、Tencent Cloud CODING DevOpsチームのメンバーによる数年にわたる研究と実践的な開発の結果、解決できるソリューションが登場しました2。生成AIの分野でコンセプトから製品への移行を支援するために設計されたさまざまなプラットフォームやツールの中で、Difyは特に革新的なソリューションとして際立っています。

以上がDify.AIの開発者と開発・影響するに至った経緯についての情報です。

 

私#7

他の生成AIプラットフォームはありますか?

Copilot#7

はい、他にもいくつかの生成AIプラットフォームが存在します。以下にいくつかを紹介します:

1.     ChatGPT:OpenAI社によって開発された対話型AIサービスです。ChatGPTのAIモデルは企業のカスタマーサービスや教育支援などで活用されており、さまざまな分野で活躍可能です。

2.     Amazon Web Services(AWS):Amazonが提供するクラウドサービスで、AI開発に必要な各種ツールやサービスを提供しています。

3.     Google Cloud Platform(GCP):Googleが提供するクラウドサービスで、AI開発に必要な各種ツールやサービスを提供しています。

4.     Microsoft Azure:Microsoftが提供するクラウドサービスで、AI開発に必要な各種ツールやサービスを提供しています。

5.     IBM Watson:IBMが提供するAIサービスで、自然言語処理や機械学習などのAI技術を提供しています。

6.     HyperCLOVA:LINE株式会社とNAVER株式会社が共同で開発した日本語の大規模言語モデルです。

これらのプラットフォームは、それぞれ異なる特性と機能を持っています。そのため、使用するプラットフォームは、具体的な開発目標や要件によります。

 

私#8

No Codeで複数の生成AIを組み合わせたアプリケーションを構築できるプラットフォームという観点では、DiFYが今のところ唯一のプラットフォームであると考えて良いですか?

Copilot#8

DiFY.AIは、その特性から見て、ノーコードで複数の生成AIを組み合わせたアプリケーションを構築できるプラットフォームとしては、現時点では特異な存在であると言えます。しかし、他にも生成AIを活用したノーコードのアプリケーション開発プラットフォームは存在します。以下にいくつかを紹介します:

1.     Create.xyz:Create.xyzは、AIがプロンプトに沿ってWebサイトやアプリケーションを自動生成するノーコード開発ツールです。プロンプトは日本語に対応しており、生成したアプリはボタンをクリックするだけで簡単に公開できます。

2.     Code AGI:Code AGIは、AIによる完全なプログラム自動生成(ノーコード)を行うアプリケーションサービスです。

3.     AppMaster:AppMasterは強力なノーコードプラットフォームで、ユーザーは広範なコーディングの専門知識がなくても、バックエンド、Web、およびモバイルアプリケーションを構築できます。

4.     Microsoft Power Apps:Microsoft Power Appsは、生成AIを用いて、自然言語による会話によってノーコードでAIアプリの開発ができます。

これらのプラットフォームは、それぞれ異なる特性と機能を持っています。そのため、使用するプラットフォームは、具体的な開発目標や要件によります。

 

私#9

これらは、すべて複数の生成AIを組み合わせて動くようなアプリケーションを創れるのでしょうか?

Copilot#9

複数の生成AIを組み合わせて動くアプリケーションを作れるプラットフォームは、現時点では限られています。

教えてAI byGMOは、最大6つのAIモデルを同時に実行できる機能を提供しています。この機能により、プロンプトを一度入力するだけで、複数のAIモデルから同時に出力結果を得ることができます。

しかし、他のプラットフォームについては、具体的な情報が不足しているため、確認が必要です。それぞれのプラットフォームの公式ウェブサイトやドキュメンテーションを参照することで、詳細な情報を得ることができます。

DiFY.AIのように、複数の生成AIを組み合わせて動くアプリケーションをノーコードで構築できるプラットフォームは、現時点ではまだ少ないと言えます。しかし、AI技術の進歩とともに、このようなプラットフォームの数も増えていくことが予想されます。

 

私#10

教えてAI byGMOは、同時に実行するだけで、複数の生成AIをモジュールとしてつなげて連係動作させる機能はなさそうですね。

Copilot#10

その通りです。教えてAI byGMOは、複数のAIモデルを同時に実行する機能を提供していますが、それらのモデルをモジュールとして連携させて動作させる機能は、現時点では提供していないようです。

一方で、DiFY.AIは複数の生成AIを組み合わせて動作させることが可能です。これにより、特定のタスクに対して最適な結果を得るために、複数のAIモデルの強みを活用することができます。

したがって、複数の生成AIをモジュールとして連携させて動作させる機能を必要とする場合、DiFY.AIのようなプラットフォームが適していると言えます。

 

私#11

現状では、DiFY.AIの優位性は、ノーコードで、かつ、複数の生成AI(や多分Pythonのプログラムなども)連携させて稼働するアプリケーションを構築できる唯一のプラットフォームであるということでよいでしょうか?

Copilot#11

はい、その理解で正確です。DiFY.AIは、ノーコードで複数の生成AIやプログラム(Pythonなど)を組み合わせて動作するアプリケーションを構築できるプラットフォームとして、現時点では特異な存在であると言えます。

DiFY.AIの特性により、開発者は複数のAIモデルやプログラムを組み合わせて、特定のタスクに対して最適な結果を得ることが可能です。これにより、開発者は自分のニーズに合わせてカスタマイズしたAIアプリケーションを簡単に作成できます。

ただし、AI技術の進歩とともに、このようなプラットフォームの数も増えていくことが予想されます。そのため、将来的には他のプラットフォームも同様の機能を提供する可能性があります。

 

私#12

Lang Chainを使ったことがないのですが、Lang Chainで例えば、GPT4やClaude 3と連携させる場合は、すべてAPI呼び出し(+そのためのPythonのコーディングが必要)と考えて良いですか?

Copilot#12

はい、その理解で正確です。Lang Chainを使用してGPT4やClaude 3などの生成AIと連携させる場合、API呼び出しとPythonのコーディングが必要となります。

Lang Chainは、生成AIモデルとの連携を容易にするためのライブラリであり、それぞれの生成AIモデルはAPIを介して呼び出されます12。したがって、Lang Chainを使用して生成AIモデルと連携するためには、Pythonのコーディングが必要となります。

具体的には、Lang ChainからClaude 3 Sonnet(AnthropicのClaude 3の一部)を呼び出すためのPythonコードが公開されています。このコードでは、Lang Chainのライブラリを使用してClaude 3 Sonnetを呼び出し、ユーザーの質問に対する回答を生成しています。

したがって、Lang Chainを使用してGPT4やClaude 3と連携させる場合、API呼び出しとPythonのコーディングが必要となります。

 

私#13

どうもありがとう。Dify.AIの優位性が良くわかりました。

Copilot#13

どういたしまして!DiFY.AIについての説明がお役に立ててうれしいです。他に何か質問がありましたら、いつでもお気軽にどうぞ。よろしくお願いします!

 

本日は以上です。

 

終わり