mouse LABO

Google「Gemini 3」正式発表!何が変わった?進化ポイントを最速まとめ

Gemini3登場 イメージ画像

 2025年11月18日、米Googleはついに「Gemini 3」を正式発表しました。ここ数か月はOpenAIからの「GPT-5」の発表や同社製のWEBブラウザ「ChatGPT Atlas」のリリース、Googleへの「AI モード」の実装など、AI周りのニュースが途切れません。

 そしてこのタイミングでの「Gemini 3」の発表。これまでのGeminiからどのように進化しているのでしょうか。Google and Alphabet CEO スンダー ピチャイは、発表のなかで「Gemini のすべての機能を統合した、これまでで最も高性能なモデル Gemini 3 を発表します。Gemini 3 は、あらゆるアイデアを現実にしますと記載しています。※1

 この記事では、今回の発表内容を分かりやすく皆さんにお届けするために、Gemini 3がどのように進化したのか、主要なポイントをまとめていきます。

※1:https://blog.google/intl/ja-jp/company-news/technology/gemini-3/#note-from-ceo

※2025年11月20日10時更新

 

「Gemini 3」とは?進化ポイントまとめ

 発表では「私たちは AGIの実現に向けての一歩となるGemini 3 を公開します」という言葉から始まりました。以前のGeminiから進化したと言われるポイントは以下の通りです。

① 圧倒的な「推論能力」の向上 (Gemini 3 Pro / DeepThink)

② Generative UI(生成UI)の導入

③ タスクをユーザーに代わって実行(Gemini Agent)

④ マルチモーダル性能の完成形

① 圧倒的な「推論能力」の向上 (Gemini 3 Pro / DeepThink)

 Gemini 3の最大の特徴は、発表でも再三記載のある圧倒的な「推論能力」の向上 (DeepThink)です。これにより、より複雑な問題を解決する推論能力が飛躍的に向上し、さらに回答を生成する際に「DeepThinkモード」が登場しました。

 DeepThinkモードは、以前のGemini寄りも深く時間をかけて思考し、よりニュアンスをくみ取った回答ができるようになっています。またニュアンスの読み取りがうまくなったために、「行間を読む」という能力も向上し、より少ないプロンプトでもユーザーの意図を正確に把握できます。

② Generative UI(生成UI)の導入

 テキストのみの回答にとどまらず、ユーザーのプロンプトに対する回答として最適なUIをその場でコード生成し、表示まで行います。これにより単なるチャットボットから、アプリのような操作感での情報提供が可能になっています。

③ タスクをユーザーに代わって実行(Gemini Agent)

 まずは米国からで日本での提供は未定となっていますが、Gemini Agentでは複数手順を踏む処理をGemini内で直接処理ができるようになったといいます。GoogleのアプリやGmailへの接続で、メールをチェックしてと指示するとメール内容を把握し、重要度の優先順位付けなども可能です。また発表では、「メールに記載されている情報を使って、来週の旅行用に 1 日 80 米ドル未満の中型 SUV を予約して」のように具体的な指示も可能としています。

④ マルチモーダル推論性能の向上

 テキスト、画像、動画、音声、コードといった内容を今まで以上に理解し、ユーザーにとって最適な回答を提示できます。例えばスポーツのプレイ動画を読み込ませれば、その動画からフォーム改善のためのアドバイスといった回答も可能です。

Gemini 3の提供範囲は?

 今回のGemini 3の提供はなんと大盤振る舞いで、一般ユーザーでもすでに昨日より「Gemini アプリ」で利用が可能です。また「Google検索 AIモード」については米国のGoogle AI Pro および Ultra のユーザーが利用可能となっています。

その他にも、開発者向け最新機能も

Vibe Coding

 Vibe Codingとは「空気(Vibe)を読んでコードを書いてくれる」技術です。従来のAIコーディングでは具体的に「●●のコードで●●の関数を書いて」などのプロンプトが必要とされていました。

 しかしこのVibe Codingでは、より感覚的な指示によってコード生成を可能とします。

 

  何ができる?

 曖昧で感覚的な言葉(Vibe)からコードが生成できる。
「レトロ風のカメラアプリを作って」といった曖昧な指示をGeminiが読み解き、コードを生成できます。

Gemini 3によくある質問

Q. Gemini 3では何が一番大きく変わったの?
  • A.もっとも大きいのは「推論力の強化」と「マルチモーダル対応の進化」です。
  • 画像・音声・動画をまとめて理解し、複雑なタスクの処理がさらに高度化され、従来より大幅にパワーアップした生成AIになりました。

 

Q. Gemini 3は日本でもすぐに使える?
  • A.はい、Geminiアプリでは「Gemini 3 Pro」のDeepThinkが解禁されています。
  • ただし、一部の機能やモデル(Pro/Ultra/Enterprise)は段階的な提供となり、また米国では提供を開始しているが日本は未定といった機能もあるため、今後のアナウンス確認が必要です。

 

Q. ChatGPTやClaudeと比べてどうなの?
  • A.それぞれの強みはありますが、Gemini 3は「マルチモーダル」「長文・大規模文脈(1Mトークン)」「エージェント性」で特に注目されています。

まとめ:今すぐGemini 3を使ってみよう!

 今回は簡単にGemini 3の発表内容や進化ポイントを絞って解説してきましたが、他にも沢山の新機能や、実際に性能の優位性を示したグラフもたくさん公開されました。

 今回のGeminiの進化がAGI開発の第一歩として、大きく踏み出したのは確かでしょう。ぜひ皆さんも、お手元のスマートフォンもしくはパソコンで、Gemini 3の性能を確かめてみてはいかがでしょうか。