クッキーとオレンジが並ぶと、「どちらも丸い食べ物ですが、オレンジの方が健康的ですね」と答え、2色の毛糸玉から作れるマスコットも提案する。 絵から太陽系の惑星の並びの間違いを指摘し、動画の「次のシーン」の予測までこなす。 これらのように、文章から回答を作るのではなく、声や画像、立体物に動画と、さまざまな情報を並列に扱って、それぞれをちゃんと理解し、論理的な回答をする。 別の例も示してみよう。 物理のテストの回答があったとする。従来なら、まず手書き認識をして、その内容が正しいかをさらに判定するだろう。 だが、Geminiでは処理を分けることもなく、Geminiが持つ能力自体で「文字認識」「回答の妥当性検証」を行い、正誤判定を出す。さらに、正しい回答を示すことも可能だ。 Geminiは「記述式テスト」の正誤判定を行い、間違いまで説明できる。出典:グーグル出典:グーグル出典:グーグルこれが、Gem