fc2ブログ

BingとBardの画像認識を比較する(1)

 お盆休みに入りましたが、台風7号が接近していますね。自宅の自室に設置している気圧センサの値も急降下中です。現在(8/12 15時)、990hPa辺りですね。AtmospherePressure_230812.png当初はお盆に帰省予定でしたが、父親の健康状態が心配だったことや実家の庭の手入れがあり、先月に実家に里帰りしました。今考えると、1か月前で良かったです・・。

 昨日(8/11)、今日(8/12)と猛暑日で外出するのも億劫なので、のんびりと日頃できなかったことをしています。

 生成AIのBing-AIBardの話をブログで何度かしていますが、今回は画像入力した画像について、以下の2点を調べ、比較しました。
 ① 画像処理をして出力できるか?
 ② 画像を正しく認識できるか?

 結論から言うと以下の通りでした(8/12現在の実力です・・)。Result_230812.pngGoogle Bardの画像認識力には驚きました。後ほど詳細をお話しします。

 結論を先に話してしまいましたが、Bing-AIで試した結果です。カラー画像を入力し、モノクロ画像を出力してくださいというものです。image_proc_ptn3_bing_230812.png質問に対する答えは「できない」ということでした。
 そういえば、画像出力ができるのは回答のスタイルの「創造性」「バランス」「厳密」の中の「創造性」のみだったことを思い出しました。この「できない」結果を出力したのは「厳密」スタイルでした。ansmode_230812.png
「創造性」スタイルにして、同じ質問をすると、回答は以下の通りでした。image_proc_ptn1_bing_230812.pngモノクロ画像が出力されていますが、入力画像のモノクロ画像でありません。ただ、そもそも生成AIは「未知」の画像を生成するもの?なので、結果は当たり前なのかもしれませんね・・。ちなみに、「バランス」スタイルで実行した結果は的外れです。質問の仕方が悪いのでしょうね。image_proc_ptn2_bing_230812.png
 次に、画像の説明をしてもらいました。以下は「創造性」スタイルの回答です。image_explaination1_bing_230812.png記載内容の中に、他の花がある?、白いチューリップが9輪?という誤った情報を出力しました。「厳密」スタイルでも白いチューリップの数については分からないという回答でした。image_explaination2_bing_230812.png
 Google Bardの方も気になったので、同じ質問をしました。現時点で画像入力を利用する際の質問はEnglish ONLYです。image_proc_bard_230812.png画像処理はできないと言う回答でBing-AIと同じです。画像の説明をお願いすると以下の長文の回答でした。image_explaination_bard_230812.png翻訳すると以下の通り。
「画像は色とりどりのチューリップ畑で、真ん中に黒いチューリップが描かれている。画像には3本の白いチューリップがあり、前列に2本、後列に1本ある。白いチューリップは、淡いアイボリーから濃いクリーム色まで、すべて異なる色合いだ。どれも花びらを大きく広げて咲いている。黒いチューリップも満開だが、花びらは固く閉じている。画像の中で最も背の高いチューリップで、周りの色とりどりのチューリップの中で際立っている。
 この画像はチューリップの多様性を美しく表現している。チューリップには実にさまざまな色や形があり、それぞれが個性的だ。黒いチューリップは特に印象的な花で、イメージに神秘的な雰囲気を添えています。
 質問の答えになっていれば幸いです!」


 紫色のチューリップを黒色と言っている点は違和感がありましたが、白いチューリップの本数や位置関係を述べている点は、正しく認識していると思われました。

 大変興味深い結果だったので、今後、追加でいろいろ調べてみようと思います。


スポンサーサイト



コメント

非公開コメント

ご訪問者数

(Since 24 July, 2016)

タグクラウド


プロフィール

Dr.BobT

Author: Dr.BobT
興味のおもむくままに生涯考え続けるエンジニアでありたい。

月別アーカイブ

メールフォーム

名前:
メール:
件名:
本文: