Salle Cricket ground
© Copyright Evelyn Simak and licensed for reuse under this Creative Commons Licence.
前回は、ChatGPT、Copilot、Gemini 1.5、Claude 3、Mistral AIに論理パズルを解かせてみました。
どうも生成AIの中には、元の問題文中の表現「兄弟」を2人組ととらえ、3兄弟というのを、兄弟3組と誤った解釈をするものがあったので、生成AIに与える問題文としては、「3兄弟」→「3人兄弟」とし、回答例として「例えばAとCとEで1組の3人兄弟、BとDとFでもう一組の3人兄弟」というように補足しました。また、元の問題文にあった「どちらの兄弟にも最低1人は嘘つきがいます。」という表現は、人間が読む場合全く問題はないのですが、なぜか成AIは、これを「兄弟(=他の2人)の1人は正直者で1人は嘘つき」のように誤解するようなので、以下の3)および4)のようにくどい表現にしました。
【生成AIに与えた問題文】 1)あるところに2組の3人兄弟がいました。 その6人をそれぞれABCDEFとします。(誰と誰が兄弟かは不明) 2)この6人のうち、3人は常に本当のことを言い(正直者)、他の3人は常に嘘をつきます(嘘つき)。 3)3人兄弟には、最低1人正直者がいます。(自分が正直者なら、自分以外の2人とも嘘つきでも良い。自分が嘘つきの場合、自分以外の2人のうち1人は正直者でなければならない) 4)3人兄弟には、最低1人嘘つきがいます。(自分が嘘つきなら、自分以外の2人とも正直者でも良い。自分が正直者なら、自分以外の2人のうち1人は嘘つきでなければならない。) 以下の証言から、どの3人が1組の3人兄弟(例えばAとCとEで1組の3人兄弟、BとDとFでもう一組の3人兄弟)で、嘘つき・正直者はそれぞれ誰なのかを日本語で答えてください。 A:「私の3人兄弟では、私以外の2人とも嘘つきです」 B:「私の3人兄弟では、私以外の2人とも正直者です」 C:「AとBは両方とも嘘つきです」 D:「私はCと兄弟です」 E:「私とBは兄弟です」 F:「Eは正直者です」 |
このように苦心したにもかかわらず、残念ながら、どの生成AIも正解にたどり着けませんでした。
人間がこのような問題を解く場合、不十分な条件設定に対して、図形問題を解くために補助線を引くような感じで、回答を導く上で利用できる情報を整理し、解き方について考えると思うのですが、今回、ChatGPT、Copilot、Gemini 1.5、Claude 3、Mistral AIという、今を時めく「クレバーな生成AI達」も、そこまで「回答を導くための明確な方針を立ててから問題解決に望む」というようなアプローチをとっていなさそうだということが確認できたのではないかと思います。
#生成AIが、そのように進化していくのも時間の問題なのかもしれませんが
さて、4月11付けで、また、新しい生成AIが公表されたようです。
「Introducing Rerank 3: A New Foundation Model for Efficient Enterprise Search & Retrieval」がそれです。
まずは、ChatGPTに、どのような生成AIなのか、日本語で解説してもらいましょう。
※ 上記の公表サイトのURLをGoogle翻訳に渡して全文をビ本後に翻訳した結果については、ここをご覧ください。
私#1: Introducing Rerank 3_ A New Foundation Model for Efficient Enterprise Search & Retrievalの記事をPDFにして、ChatGPTにアップ UPしたニュース記事を詳しく日本語で解説してください。 ChatGPT4#1: 「Rerank 3: 効率的な企業検索と取得のための新しい基盤モデル」と題された記事では、Cohere社が開発した最新の基盤モデル「Rerank 3」について詳細に紹介されています。このモデルは、企業の検索と情報取得(Retrieval Augmented Generation, RAG)システムを目的としており、以下のような主要な機能を持っています。 1.長い文脈の処理能力: Rerank 3は、最大4,000単語の文脈を扱えることが可能です。これにより、長文書を一括で評価し、その内容を深く理解することができるため、関連性の高い検索結果を提供します。この機能は、特に詳細な情報が必要な研究や分析業務において役立ちます。 2.多様なデータ形式の検索能力: 電子メール、請求書、JSON文書、プログラムコード、表といった多面的で半構造化されたデータ形式を効果的に扱います。各データの関連するメタデータを用いてランク付けを行い、情報の新しさも考慮に入れることで、必要な情報を迅速に抽出します。 3.多言語対応: 100以上の言語に対応しており、国際的な企業が世界各地のデータを一元管理する際に特に有用です。これにより、異なる言語の文書に対しても高い検索精度を実現し、グローバルなビジネス運営をサポートします。 4.改善されたレイテンシと所有コストの低減: 高精度なセマンティック再ランキングを通じて、最も関連性の高い文書のみを選択的に処理します。これにより、応答速度が向上し、大規模な文書データベースを持つ企業にとっては、運用コストの削減と効率的な検索が可能になります。 加えて、このモデルはElasticsearchの推論APIにもネイティブでサポートされており、Elasticsearchは分散型の高速検索エンジンとして知られ、JSON形式の文書をリアルタイムで処理する能力が特徴です。ElasticsearchとRerank 3の組み合わせにより、検索クエリの処理能力が強化され、複雑な企業データを効率的に検索し、精度の高い情報提供が可能となります。 これらの特性により、Rerank 3は様々なビジネス機能にわたって関連情報を効率的に取得し、企業がその保有するデータから大きな価値を引き出すことを可能にします。この技術進化は、顧客サポート、法務、人事、財務といった多くの部門でのタスクを支援し、企業の生産性向上に寄与することが期待されます。
私#2: 効率的という点はわかりました。ハルシネーション対策として、ChatGPT、Copilot、Gemini 1.5、Claude 3、Mistral AIより秀でた点はありますか? ChatGPT4#2: Rerank 3が他のAIモデルと比較して、ハルシネーション(生成された内容が事実に基づかない問題)対策で優れている点は、その高精度なセマンティック再ランキング機能にあります。Rerank 3は、検索と情報取得に特化したモデルであり、以下の特徴がハルシネーションを抑制する上で効果的です。 1.文書の関連性と正確性の向上: Rerank 3は、入力されたクエリに最も関連する文書を高精度に選択する能力があります。これは、検索結果から不正確な情報を排除し、より事実に基づいた情報を抽出することに直接寄与します。 2.長い文脈の理解: 文脈が長い場合でもその全体を理解し、文書内の情報の関連部分を精確に評価できます。これにより、文脈外の情報や関連性の低い情報に基づいた誤った生成を減少させることができます。 3.多言語と多様なデータ形式の扱い: 多言語対応能力と多様なデータ形式(電子メール、請求書、コードなど)を処理できることで、より広範なデータから正確な情報を取り出し、ハルシネーションのリスクを低減します。 これらの特性により、Rerank 3は特に情報の検索と選択の正確性において、他のAIモデルと比較して優位性を持ちます。例えば、ChatGPTやCopilotのような一般的な言語生成モデルは広範な内容を生成することができますが、特定の検索クエリに基づいた正確な文書の選択という点では、Rerank 3のような専門的な検索向けモデルがより有効です。これにより、ハルシネーションを抑えつつ、必要な情報の正確な取得を支援することができます。
私#3: 4つの特徴の中では、「多様なデータ形式の検索能力」の中でランク付けの話が出ていますが、「Re-Rank」の名前の由来は、ランクを付け直すということを表しているのでしょうか? ChatGPT4#3: はい、その通りです。「Re-Rank」という名前は、検索結果の「ランク付けを再評価、または再構築する」という機能に由来しています。Rerank 3モデルは、特に検索されたデータに対して最も関連性が高いと判断される文書や情報を「再ランク付け」することに特化しています。これにより、検索結果の精度と有用性が大幅に向上します。 このプロセスは、特に多様なデータ形式(電子メール、請求書、JSON文書、コード、表など)が絡む場合に重要です。Rerank 3はこれらの異なる形式のデータから、クエリに最も関連する情報を抽出し、それに基づいて内容を再ランク付けします。これにより、ユーザーが求める情報をより迅速かつ正確に提供できるようになり、検索の効率性と効果性が高まります。 この再ランク付け機能は、Rerank 3が企業の検索と情報取得システムにおいて重要な役割を果たす理由の一つです。文書やデータの関連性を精確に評価することで、不要な情報を除外し、必要な情報のみをユーザーに提供することができるのです。 |
ということで、Rerank 3は情報検索に向いていそうです。
AI情報検索として、先に調べたPerplexityと比べてどうなのでしょうか?
そもそもPerplexityはRerank 3をどのように評価するのか尋ねてみました。
私: Cohere社がRerank 3という新しい生成AIをリリースしたようなので、調べてください。 Perplexityの回答: ソース ① 優秀と噂なCohere社のCommand R+でRAGチャットボットを簡単に構築して体験しよう! ② アクセンチュアがOpenAI競合のCohereと提携、顧客企業9,000社超に生成AIソリューション提供へ ③ Cohere、エンプラ用LLM「Command-R」を公開——OpenAI「GPT-3.5-turbo」など主要LLMの性能を凌駕 ④ OpenAIのライバル、Cohere共同創業者が一押しするAI幻覚対策の切り札「Rerank」 ⑤ 2024年の生成AIは「コスト削減」がテーマに、LLMならぬ小規模言語モデルに注目 ⑥ リコーが日本語特化の自社開発LLM発売/あいおいニッセイ同和損保がデータから交通安全を考える特別授業 ⑦ Adobeトレーニングデータ物議、第2回AI安全サミット、CohereのRerank 3、GPT-4 Turbo【AIニュース】
回答 Cohere社が「Rerank 3」という具体的な新しい生成AIモデルをリリースしたという情報は、提供された検索結果の中には見当たりません。しかし、Cohere社が開発した技術やモデルに関する情報はいくつか見つかりました。 Cohere社は、大規模言語モデル(LLM)の開発に注力している企業であり、その技術は「Command R+」や「Embed」「Rerank」といったモデルによって代表されています。特に「Rerank」という技術は、検索結果を重要度に応じて順位付けする機能を持ち、大規模言語モデルの弱点であるハルシネーション(幻覚)への対策として期待されています④。 「Command R+」は、Cohere社が最近リリースしたLLMであり、GPT-4に迫る性能を発揮しているとされ、RAG(Retrieval Augmented Generation:検索拡張生成)を利用した性能で話題となっています⓵。また、Cohereは「Command-R」という新言語モデルも公開しており、これは検索拡張生成(RAG)やツールの使用などの主要なAIタスクにおける性能の向上、最大128,000トークンまでの長いコンテキストウィンドウ、およびより手頃な価格設定を提供することで、Cohereの技術にとって大きな飛躍を意味しています③。 したがって、「Rerank 3」というモデルのリリースについては確認できませんでしたが、Cohere社は「Rerank」という技術を含む複数の先進的なAIモデルや技術を開発しており、これらは企業やエンタープライズのAIソリューションとして提供されています。 |
ということで、Perplexityは、4月11付けのRank 3の発表記事は見つけられませんでしたが、Rerank 3が公開されるまでのCohere社の製品情報、およびRerankという技術が大規模言語モデルの弱点であるハルシネーション(幻覚)への対策として期待されていることが分かりました。
ちなみに、Perplexityに英語で質問すれば、Rerank 3発表の記事を見つけられていたのでしょうか?試してみました。
私: It looks like Cohere has released a new generation AI called Rerank 3, so check it out. Perplexityの回答: ソース ① Cohere | The leading AI platform for enterprise ② Anthropic Launches Claude 3 Model Family With Breakthrough Capabilities ③ How Insurers Can Unlock Their Data Vaults with AI ④ Cohere’s Enterprise AI Offering Is Now Generally Available on OCI Generative AI Service ⑤ New AI Patent Study Shows IBM Leads Google and Microsoft in GenAI Race 回答 Cohere has indeed released a new generation AI called Rerank 3, which is designed to deliver reliable and up-to-date responses for applications, grounding retrieval-augmented generation (RAG) in the data⓵. The combination of Rerank and Embed delivers the most reliable and up-to-date responses for your application, ensuring that the AI models are optimized for enterprise generative AI, search and discovery, and advanced retrieval⓵. The models are built on the language of business and are optimized for enterprise use, making them suitable for a wide range of business applications⓵. The Rerank 3 model is available on Oracle Cloud through the OCI Generative AI service, which also provides fine-tuning features for businesses to customize the models for their specific needs④. The models are designed to support a wide range of business use cases, including automating customer service operations, personalizing search and marketing outreach based on buyer profiles, creating virtual sales representatives, and expediting contract drafting with multilingual support④. Cohere’s AI solutions are already being used by insurers to extract unstructured data from various reports and reduce the time it takes to distill large reports into more manageable summaries③. The use of AI knowledge assistants and RAG technology has enabled insurers to gain the necessary levels of accuracy at a cost that makes sense for the organization③. In summary, Cohere’s new generation AI, Rerank 3, is designed to deliver reliable and up-to-date responses for enterprise applications, grounding retrieval-augmented generation (RAG) in the data. It is available on Oracle Cloud and is being used by insurers to extract unstructured data and reduce the time it takes to distill large reports into more manageable summaries. |
なんと、英語で同じ質問をすると、PerplexityはRerank 3リリースの記事を見つけ出しました。
ChatGPTに要約させると、以下の通りです。図らずも、Perplexityへの質問の仕方として、日本には出回っていない情報を検索する場合は、英語で検索する方が良いということが分かりました。
【ChatGPT4によるPerplexityのRerank 3情報の要約】 Cohere社は、企業アプリケーション用に信頼性が高く最新の応答を提供するために設計された新世代のAI「Rerank 3」をリリースしました。このモデルは、データに基づいて情報取得強化生成(RAG)を実現し、企業のジェネレーティブAI、検索および発見、高度な情報取得のために最適化されています。Rerank 3はOracle CloudのOCI Generative AIサービスで利用可能であり、ビジネスに合わせたカスタマイズも可能です。 このAIソリューションは、顧客サービスの自動化、バイヤープロファイルに基づく検索とマーケティングのパーソナライズ、バーチャル営業担当者の作成、多言語サポートによる契約書の迅速な作成など、幅広いビジネス用途に対応しています。また、保険業者はこれを使用してさまざまなレポートから非構造化データを抽出し、大規模なレポートをより管理しやすい要約に短縮する時間を削減しています。 |
次に、Rerank 3を試してみるWebインタフェースがあるかどうか訊いてみましょう。
私: Is there some Chat interface for Rerank 3 like ChatGPT? Perplexityの回答: ソース ① Build Conversational AI into your Apps with RAG ② How to Build a RAG-Powered Chatbot with Chat, Embed, and Rerank 6 件をもっと見る 回答 Cohere’s Rerank 3 does not have a Chat interface like ChatGPT. However, Cohere does offer a Chat interface that integrates retrieval-augmented generation (RAG) to build more powerful product experiences⓵. The Chat interface allows you to handle the main logic of the chatbot, including turning a user message into queries, generating responses, and producing citations②. To use Cohere’s Chat interface, you can follow the steps provided in the search results, which include importing the necessary libraries, setting up the Cohere API key, defining the query and documents, and using the Chat endpoint to generate responses with citations②. The Chat interface is designed to improve the accuracy of responses by incorporating external data and reducing hallucinations, which are common issues in large language models③. While Rerank 3 does not have a specific Chat interface, you can use the Chat interface provided by Cohere to build chatbots that can connect to external documents, ground their responses on these documents, and produce inline citations in their responses③ |
残念ながら、Mistral AIのようなベータ版のチャットインタフェースもまだないようです。
どうしても、今すぐ使いたい場合の方法もPerplexityが以下の通り教えてくれましたが、今回の報告は、ここまでとします。
おわり
- 投稿タグ
- ChatGPT-4, Perplexity, Rerank 3, ハルシネーション
Pingback: Difyについてーその5(Rerankモデルの利用) – インターテックリサーチ株式会社