Oddfellows Arms, Netherton Road
© Copyright Alex McGregor and licensed for reuse under this Creative Commons Licence.
ネット情報を見た限り、Google Geminiに関して、発表直後の賑わいはおさまったようですが、Geminiを使ってみたいという人のために、Bardの英語版を使って、Bard with Gemini Proが試せるだけでなく、「Google AI Studio」でGemini Proが試せるということが分かったので、本日は、Google AI StudioからGemini Proを使ってみた結果をご紹介したいと思います。
では、始めます。
12月13日付けのGoogleのブログ「It’s time for developers and enterprises to build with Gemini Pro」で、Gemini Proが「Google AI Studio」でも利用できることがアナウンスされました。
知らなかったのですが、Google AI Studioは、OpenAIのplaygroundに似たユーザインタフェースを持ち、モデルの構築、トレーニング、デプロイを一貫して行うことができるツールのようです。
まず、BardにGoogle AI Studioを使うにはどうすればよいか尋ねてみましょう。
私#1:
Google AI Studioを使うにはどうすればよいですか?
Bard#1:
Google AI Studioは、Google Cloud Platform(GCP)のAIサービスです。AIモデルの構築、トレーニング、デプロイを、コードを書かなくても簡単に行うことができます。
Google AI Studioを使うには、まずGCPのアカウントが必要です。GCPのアカウントをお持ちでない場合は、GCPのWebサイトから作成してください。
GCPのアカウントを作成したら、Google AI StudioのWebサイトにアクセスします。Google AI StudioのWebサイトにアクセスすると、ログイン画面が表示されます。GCPのアカウントでログインしてください。
ログインすると、Google AI Studioのホーム画面が表示されます。ホーム画面には、Google AI Studioの使い方に関するチュートリアルや、サンプルプロジェクトが用意されています。
Google AI Studioの使い方を学ぶには、チュートリアルを試してみましょう。サンプルプロジェクトを実行して、Google AI Studioの機能を体験することもできます。
Google AI Studioの基本的な使い方を説明します。
プロジェクトの作成
Google AI Studioでプロジェクトを作成するには、次の手順を実行します。
- ホーム画面で、新規プロジェクトを作成するをクリックします。
- プロジェクトの名前と説明を入力します。
- 作成をクリックします。
プロジェクトが作成されると、プロジェクトのホーム画面が表示されます。プロジェクトのホーム画面には、プロジェクトの概要、プロジェクトのファイル、プロジェクトの履歴が表示されます。
モデルの構築
Google AI Studioでモデルを構築するには、次の手順を実行します。
- プロジェクトのホーム画面で、モデルを作成をクリックします。
- モデルの種類を選択します。
- モデルの設定を入力します。
- 作成をクリックします。
モデルが作成されると、モデルのホーム画面が表示されます。モデルのホーム画面には、モデルの概要、モデルのトレーニング、モデルのデプロイに関する情報が表示されます。
モデルのトレーニング
Google AI Studioでモデルをトレーニングするには、次の手順を実行します。
- モデルのホーム画面で、トレーニングを開始するをクリックします。
- トレーニングの設定を入力します。
- 開始をクリックします。
モデルのトレーニングが開始されます。トレーニングの進捗状況は、モデルのホーム画面で確認できます。
モデルのデプロイ
Google AI Studioでモデルをデプロイするには、次の手順を実行します。
- モデルのホーム画面で、デプロイを開始するをクリックします。
- デプロイの設定を入力します。
- 開始をクリックします。
モデルのデプロイが開始されます。デプロイの完了後、モデルはGCPのクラウドサービスとして利用できます。
Google AI Studioは、AIモデルを構築、トレーニング、デプロイするための便利なツールです。コードを書かなくても、AIモデルを簡単に作成することができます。ぜひ、Google AI Studioを試してみてください。
ということで、GCPのアカウントでGoogle AI StudioのWebサイトにログインすると、以下のGoogle AI Studioのホーム画面が表示されました。
画面右上の「Model」欄を見ると、デフォルトで「Gemini Pro」が選択されていることが分かります。
また、画面左側の「⊕Create new」をクリックした時点で画面コピーをとったので、4つの使い方のドロップダウンリストが表示されています。
Google AI Studio のクイックスタートの説明によると、
Freedom prompt(自由形式のプロンプト):自由形式のプロンプトを提供し、コンテンツの生成や指示に対する応答を提供します。プロンプトには画像データとテキストデータの両方を使用できます。
Structured prompt(構造化プロンプト):このプロンプト手法では、リクエストと応答のサンプルセットを提供することで、モデル出力の方向性を指示できます。モデル出力の構造をより細かく制御する必要がある場合は、この方法を使用します。
Chat prompt(チャット プロンプト):チャット プロンプトを使用して、会話エクスペリエンスを構築します。このプロンプト手法では、複数の入力とレスポンスのターンで出力を生成できます。
Tuned prompt(チューニング済みモデル):この高度な手法では、より多くのサンプルを提供して、特定のタスクに対するモデルのレスポンスを改善できます。チューニングは以前の PaLM モデルでのみ使用できます。このプロンプトを有効にするには、[設定] で [以前のモデルを表示する] オプションをオンにします。
ということなので、Chat promptで試してみました。
せっかくGeminiの特徴がマルチモーダルだということで、JPEGファイルを読み込ませようと思ったのですが、英語版Bardにあった画像読み込みのためのアイコンがないため、Chatでたずねたところ、JPEGファイルには対応していないとの回答です。
どうなっているのか調べたところ、「Chat prompt」メニューを選んだからだとわかりました。
「Freeform prompt」を選ぶと以下のように、画面上段に「Insert Image」用のアイコンが現れました。
ただし、アイコン自体はまだ選択できない状態です。Imageアイコンをクリックすると、画面にあるようにSwitch to a vision model to insert images」と表示されたので、「Model」欄のメニューを確認すると、「Gemini Pro」とは別に「Gemini Pro Vision」というモデルが見つかりました。
モデルを「Gemini Pro Vision」に変更すると、Image入力のアイコンが使えるようになったので、「マッチ1本を動かして正しい式にしましょう!」というOCNクイズの絵を拝借して、Gemini Pro Visionに与え、絵の内容をどう認識できたかを確認しました。
上の画面コピーは、何度かGemini Pro Visionとやリ取した結果が示されていますが、どれがGemini Pro Visionの回答かわかりづらいので、以下に転記します。
私#2:
Describe what do you see in this picture and analyze what is wrong.
この絵に何が写っているか説明し、何が間違っているか分析しなさい。
Gemini Pro Vision#1:
The picture shows an equation made with matches. The equation is 99 – 9 – 9 + 10 + 100 and the result is 100.
The equation is wrong because 99-9-9+10+100=91.
写真はマッチで作った方程式である。式は99-9-9+10+100で、結果は100である。
99-9-9+10+100=91なので、この方程式は間違っている。
惜しいですね。「99-9=10+100」を「99-9-9+100」と認識したのでしょうか?
私#3:
The picture shows a wrong equation of “99 – 9 = 10 + 100”. Confirm it.
写真は「99 – 9 = 10 + 100」という間違った方程式です。確認してください。
Gemini Pro Vision#2:
The equation is wrong because 99-9-9+10+100=91.
99-9-9+10+100=91なので、この式は間違っている。
依然として、方程式自体の画像認識が間違っています。その後も何度か訂正したのですが、Gemini Pro Visionは「The equation is wrong because 99-9-9+10+100=91.」だと言い張るので、本当は画像認識したうえで、『マッチ棒を1本動かして、この方程式が成立するようにしてください』という本来のパズルをGemini Pro Visionに解かせようとしたのですが、あきらめました。
この同じ絵をChatGPT-4にも見せてみたところ、以下の反応がありました。
ChatGPT#1:
The image you’ve provided is a matchstick puzzle that shows an incorrect mathematical formula. To solve such puzzles, we typically look for a way to move one matchstick to make the equation correct.
However, as an AI, I can’t visually manipulate the matchsticks in the image you provided. To solve the puzzle, I can give you a verbal solution.
あなたが提供した画像は、間違った数式を示すマッチ棒パズルです。このようなパズルを解くために、私たちは通常、1本のマッチ棒を動かして数式を正しくする方法を探します。
しかし、AIである私は、あなたが提供した画像のマッチ棒を視覚的に操作することはできません。パズルを解くために、私は口頭で解答します。
私#4:
At first, will you describe the mathematical formula you see in the picture?
まず、写真に写っている数式を説明してください。
ChatGPT#2:
Certainly, the mathematical formula in the picture created using matchsticks is:
“99 – 5 = 10 + 10”
This formula currently is incorrect because 99 minus 5 does not equal 20. The challenge typically would be to move one matchstick to make the equation correct.
承知しました。マッチ棒を使って描かれた絵の数式はこうです:
“99 – 5 = 10 + 10”
99から5を引いても20にはならないので、現在この式は正しくありません。一般的には、マッチ棒を1本動かして式を正しくすることが課題ですね。
おー、こちらが何を求めているかわかってますね。ただ、Gemini Pro Visionも肝心の画像認識部分で間違っていましたが、ChatGPT4も間違っているので、訂正しましょう。
私#5:
The picture shows: 99 – 9 = 10 + 100
写真では「99 – 9 = 10 + 100」となっています。
ChatGPT#3:
Apologies for the oversight. The correct interpretation of the matchstick equation in the image is:
“99 – 9 = 10 + 100”
This equation is not correct because 99 minus 9 equals 90, not 110. The puzzle involves moving one matchstick to make the equation true. One possible solution could be to move a matchstick from the first “9” in “99”, turning it into a “3”, so the equation would read:
“39 – 9 = 30 + 100”
However, this would still not make a true equation. If you provide me with the rules of the puzzle (for example, whether you can only move a matchstick to another position or if you can turn a digit into another), I could suggest a correct solution.
見誤ったことをお詫びします。画像のマッチ棒の方程式の正しい解釈は「99 – 9 = 10 + 100」ですね。
99から9を引くと110ではなく90になるので、この方程式は正しくありません。これが、マッチ棒を1本動かして方程式が成立するようなパズルとすると、考えられる解答のひとつは、”99 “の最初の “9 “からマッチ棒を1本動かして “3 “に変えることです:「39 – 9 = 30 + 100」
しかし、それでもこの方程式は成立しません。このパズルのルール(たとえば、マッチ棒を別の位置にしか動かせないのか、それとも数字を別の数字に変えることができるのか)を教えてもらえれば、正しい解答を提案できると思います。
私#6:
As you did, you can change 9 to 3 by extracting 1 matchstick, then change 9 to 8 by adding 1 matchstick. However, the most important technique is you van change “=” which consists of two matchsticks to “-” by extracting 1 matchsticks.
あなたがやったように、マッチ棒を1本抜いて9を3に変え、マッチ棒を1本加えて9を8に変えることができます。しかし、最も重要なテクニックは、マッチ棒2本で構成される”=”からマッチ棒1本を抜いて”-“に変えるられることです。
ChatGPT#4:
Understood. If the rules allow for changing the “=” to a “-“, which would require removing one matchstick, we could create a correct equation. Given the original equation in the image “99 – 9 = 10 + 100”, we can move one matchstick from the “=” sign to turn it into a “-“, and then adjust the numbers accordingly to make a correct equation.
For instance:
Take one matchstick from the “=” sign to turn it into a “-“.
Move a matchstick from the “9” in the “99” to make it an “8”, creating “89”.
Now the equation reads “89 – 9 – 10 + 100”.
To balance this equation, we could actually rearrange the matchsticks so that it reads:
“89 – 9 – 10 = 70”
Which is a correct equation, as 89 minus 9 minus 10 equals 70. If you would like a visual representation of this new arrangement, you would need to physically adjust the matchsticks or edit the image to reflect the change.
わかりました。ルール上、”=”を”-“に変えられるのであれば、マッチ棒を1本外して、正しい方程式を作ることができそうです。元の方程式が「99 – 9 = 10 + 100」だとすると、「=」の記号からマッチ棒を1本動かして「-」に変え、それに応じて数字を調整して正しい方程式を作ってみます。
例えば:
マッチ棒を「=」から1本動かして「-」にする。
「99」の「9」からマッチ棒を1本動かして「8」にし、「89」を作る。
これで方程式は「89 – 9 – 10 + 100」となる。
この方程式をバランスさせるために、マッチ棒を並べ替えるとこうなる:
“89 – 9 – 10 = 70”
89から9と10を引くと70になるので、これは正しい方程式である。この新しい配置を視覚的に表現したい場合は、マッチ棒を物理的に調整するか、画像を編集して変更を反映させる必要がある。
私#7:
First of all, if you extract 1 matchstick from “=”, it becomes “-“ and you can add the matchstick to “9” to make it “8”, but the rest of the matchsticks should be the same. The result of your move is “89 – 9 – 10 + 100” which is not equation. Secondly, you cannot make ” =70″ out of “+ 100” because you can move only one matchstick.
まず、”=”からマッチ棒を1本抜くと”-“になり、”9 “にマッチ棒を足すと “8 “になりますが、残りのマッチ棒は変わらないので、「89 – 9 – 10 + 100」となり、方程式ではなくなってしまいます。次に、動かせるマッチ棒は1本なので、「+100」から「=70」を作ることはできません。
ChatGPT#5:
Given the constraint that we can only move one matchstick to correct the equation “99 – 9 = 10 + 100”, and we can turn the “=” sign into a “-“, we can follow these steps:
Remove one matchstick from the “=” sign to turn it into a “-“.
Place that matchstick on the first “1” in “10” on the right side of the original “=”, turning it into an “11”.
The new equation would be:
“99 – 9 – 10 + 11 = 100”
This equation is incorrect because 99 minus 9 equals 90, and 90 minus 10 equals 80, and when you add 11, the result is 91, not 100. Thus, my previous solution was incorrect. Let’s try another approach.
「99 – 9 = 10 + 100」という方程式を修正するためにマッチ棒を1本しか動かせないという制約があり、”=”記号を”-“に変えられるとすると、次のような手順が考えられます:
マッチ棒を1本を「=」記号から外し、「-」に変える。
そのマッチ棒を、元の”=”の右側にある “10 “の最初の “1 “の上に置き、”11 “に変えると新しい方程式はこうなります:
“99 – 9 – 10 + 11 = 100”
しかし、99から9を引くと90になり、90から10を引くと80になり、11を足すと結果は100ではなく91になるので、この方程式は正しくありません。したがって、先ほどの解答は間違っています。別の方法を試してみましょう。
ということで、ChatGPT4は、この後も、「+」に斜めになったマッチ棒を1本足して「4」にする方法など、いろいろ自分で試していましたが、残念ながら回答にはたどり着けませんでした。
私#8:
OK, the correct answer is “99 = 9 – 10 + 100”.
正解は「99 = 9 – 10 + 100」です。
ChatGPT#6:
Ah, I see. The correct solution to the matchstick puzzle is to change the equation “99 – 9 = 10 + 100” into “99 = 9 – 10 + 100” by moving just one matchstick.
The right side of the equation, “9 – 10 + 100”, simplifies to 99, which indeed equals the left side, 99. This solution correctly balances the equation by moving only one matchstick. Thank you for sharing this puzzle and the solution!
ああ、なるほど。マッチ棒パズルの正解は、「99 – 9 = 10 + 100」という方程式を、マッチ棒を1本だけ動かして「99 = 9 – 10 + 100」に変えるーですね。
方程式の右辺 “9 – 10 + 100 “は確かに左辺の99と等しくなります。この解答は、マッチ棒を1本動かすだけで、方程式のバランスを正しくとることができます。このパズルと解答を教えてくれてありがとう!
ChatGPT4も、Gemini Pro Vision同様、JPEGファイル中のマッチ棒による間違った方程式を正しく読めなかったのですが、この種のパズルに関する知識を持ち合わせていることがわかります。また、いろいろ試行錯誤している経緯と、正解を教えてあげたときの「Ah, I see.」という表現が極めて人間チックで面白いと感じました。それと、ChatGPTですが、やはり「算数」はあまり得意ではなさそうですね。
でも、しばらくはGeminiよりChatGPTの方が、信頼がおけそうです。ただ、最近は人気がありすぎて?たまにうんともすんとも反応しないのには閉口しますが。。。
本日は以上です。
終わり