2023/08/12
BingとBardの画像認識を比較する(1)
お盆休みに入りましたが、台風7号が接近していますね。自宅の自室に設置している気圧センサの値も急降下中です。現在(8/12 15時)、990hPa辺りですね。
昨日(8/11)、今日(8/12)と猛暑日で外出するのも億劫なので、のんびりと日頃できなかったことをしています。
生成AIのBing-AIとBardの話をブログで何度かしていますが、今回は画像入力した画像について、以下の2点を調べ、比較しました。
① 画像処理をして出力できるか?
② 画像を正しく認識できるか?
結論から言うと以下の通りでした(8/12現在の実力です・・)。

結論を先に話してしまいましたが、Bing-AIで試した結果です。カラー画像を入力し、モノクロ画像を出力してくださいというものです。

そういえば、画像出力ができるのは回答のスタイルの「創造性」「バランス」「厳密」の中の「創造性」のみだったことを思い出しました。この「できない」結果を出力したのは「厳密」スタイルでした。

「創造性」スタイルにして、同じ質問をすると、回答は以下の通りでした。


次に、画像の説明をしてもらいました。以下は「創造性」スタイルの回答です。


Google Bardの方も気になったので、同じ質問をしました。現時点で画像入力を利用する際の質問はEnglish ONLYです。


「画像は色とりどりのチューリップ畑で、真ん中に黒いチューリップが描かれている。画像には3本の白いチューリップがあり、前列に2本、後列に1本ある。白いチューリップは、淡いアイボリーから濃いクリーム色まで、すべて異なる色合いだ。どれも花びらを大きく広げて咲いている。黒いチューリップも満開だが、花びらは固く閉じている。画像の中で最も背の高いチューリップで、周りの色とりどりのチューリップの中で際立っている。
この画像はチューリップの多様性を美しく表現している。チューリップには実にさまざまな色や形があり、それぞれが個性的だ。黒いチューリップは特に印象的な花で、イメージに神秘的な雰囲気を添えています。
質問の答えになっていれば幸いです!」
紫色のチューリップを黒色と言っている点は違和感がありましたが、白いチューリップの本数や位置関係を述べている点は、正しく認識していると思われました。
大変興味深い結果だったので、今後、追加でいろいろ調べてみようと思います。
スポンサーサイト
コメント