Google 推出 Gemini 3：「博士級推理、多模態理解、能讀懂空氣」全面升級並同步導入搜尋 AI 模式

Google推出新一代人工智慧（AI）模型Gemini 3。（圖取自Google網頁blog.google）

引用來源：
Google發表新一代AI模型Gemini 3　推理能力博士級能理解用戶意圖 (中央通訊社)
Google釋出Gemini 3，強化推理、多模態及代理人能力 (ithome網)
Gemini 3 開啟智慧新紀元 (GOOGLE台灣官方部落格)

Google 正式推出全新 AI 模型 Gemini 3，被官方稱為目前最強、也最「聰明」的版本，不只加強推理能力、跨模態理解能力，還能更準確掌握使用者意圖，甚至能「讀懂空氣」，在不用繁瑣提示的情況下產生更精準的回答。Gemini 3 也是 Google 第一次在模型發布首日就同步導入搜尋功能（AI 模式）。

Google 執行長 Sundar Pichai 表示，Gemini 3 是公司規模最大、最完整的 AI 迭代計畫之一。「短短兩年內，AI 從能讀文字、看圖像，進化到能理解脈絡並給出有深度的答案。」他表示 Gemini 3 會給出更直接、有洞察力的回應，而不是討好式的回答。

兩個主要版本：Pro 與 Deep Think

Gemini 3 Pro

目前可正式使用的版本，支援多模態推理、Vibe coding、100 萬 Token 長脈絡視窗，並在多項基準測試創新高：

• LMArena：1501 Elo，排名第一
• Humanity’s Last Exam：37.5%
• GPQA Diamond：91.9%（博士級科學推理）
• MathArena Apex：23.4%（高難度數學推理）
• MMMU-Pro / Video-MMMU 皆刷新多模態紀錄

Gemini 3 Deep Think

更偏向深度推理的模式，在最新測試中表現甚至超越 Pro，像 Humanity’s Last Exam 得分提升到 41.0%，未來將提供給 Google AI Ultra 訂閱者。

可學習、建構與規劃：更多實際應用

Gemini 3 支援跨文字、影音、圖片、影片和程式碼的輸入，例如：

• 解析手寫家族食譜 → 轉成可分享的電子食譜
• 看學術論文 → 產出單字卡、可互動圖表、可執行程式碼
• 分析球類運動影片 → 給出技巧與訓練建議

Google 推出 Gemini 3：「博士級推理、多模態理解、能讀懂空氣」全面升級並同步導入搜尋 AI 模式

圖/翻攝 Google

在搜尋 AI 模式中，它能根據查詢即時生成視覺化介面。例如查「房貸比較」，Gemini 會直接做出客製化試算工具，而不是只給文字結果。

對開發者：更強的 Vibe coding 與代理能力

Gemini 3 在自動化開發與代理任務上全面升級：

• WebDev Arena：1487 ELO（第一）
• SWE-bench Verified：76.2%
• Terminal-Bench 2.0：54.2%

同時 Google 推出全新平台 Google Antigravity，讓開發者可以讓 AI 自主規劃開發任務、寫程式、跑終端、驗證結果，像是有一個「能自己寫完 App 的開發夥伴」。

Gemini 3 也在第三方平台上線，包括 Cursor、JetBrains、GitHub、Replit 等。

長程規劃：能做跨天、跨周的任務

透過跨應用操作與工具使用，Gemini 3 可協助：

• 排旅行
• 管理 Gmail 收件匣
• 多步驟工作流程

在 Vending-Bench 2 測試中，模型能模擬經營販賣機一年且保持策略一致，顯示其真能做「持續性決策」而不是短線反應。

圖 / AI產出

功能特色與技術優勢

• 多模態理解（Multimodal understanding）

Gemini 3 不僅處理文字，還能理解圖像、影片、音訊、程式碼等多種資料形式。

它支援「長脈絡視窗」——高達 100 萬個詞元 (tokens) 的輸入，使其可處理大型資料集、長篇文章或多媒體輸入。

範例：你可以上傳手繪草圖、設計版面、圖片等，Gemini 3 會自動 “看懂” 並將其轉成 HTML/CSS/JavaScript 程式碼。

• 推理能力顯著提升

1.Google 表示這是 “最頂尖的推理能力” 模型，設計來掌握深度與細微差異。
2.在多項基準測試中創下新高，顯示其在理解、分析、解決問題的能力上強於前代。

• 代理與編碼能力（Agentic & Vibe Coding）

1.Gemini 3 擁有更強的代理能力（agentic capabilities）：能執行多步驟工作流程、使用工具、調用 API、甚至自動規劃任務。
2.針對開發者，它還加強了「Vibe Coding」能力：從提示到 UI、從草圖到互動程式碼轉換，都更加自動化、互動性更高。

• 整合 Google 生態系統與搜尋界面更新

1.Gemini 3 被同步導入到 Google Search AI 模式，搜尋界面會依你的查詢生成互動式、視覺化的回應，而不只是文字。
2.生成式 UI（Generative UI）：當你提出複雜查詢時，系統可能直接生成圖表、互動模擬、工具或專屬回應版面。

• 安全與責任建構（Responsible AI）

Google 指出 Gemini 3 是該公司迄今「最安全的模型」，進行了最全面的安全評估。表現出「減少奉承式回答／強化對提示注入(prompt injection)的抵抗」「改善網路攻擊濫用的防護」。

影片來源:Google DeepMind