Google推出新一代人工智慧(AI)模型Gemini 3。(圖取自Google網頁blog.google)
引用來源:
Google發表新一代AI模型Gemini 3 推理能力博士級能理解用戶意圖 (中央通訊社)
Google釋出Gemini 3,強化推理、多模態及代理人能力 (ithome網)
Gemini 3 開啟智慧新紀元 (GOOGLE台灣官方部落格)
Google 正式推出全新 AI 模型 Gemini 3,被官方稱為目前最強、也最「聰明」的版本,不只加強推理能力、跨模態理解能力,還能更準確掌握使用者意圖,甚至能「讀懂空氣」,在不用繁瑣提示的情況下產生更精準的回答。Gemini 3 也是 Google 第一次在模型發布首日就同步導入搜尋功能(AI 模式)。
Google 執行長 Sundar Pichai 表示,Gemini 3 是公司規模最大、最完整的 AI 迭代計畫之一。「短短兩年內,AI 從能讀文字、看圖像,進化到能理解脈絡並給出有深度的答案。」他表示 Gemini 3 會給出更直接、有洞察力的回應,而不是討好式的回答。
兩個主要版本:Pro 與 Deep Think
Gemini 3 Pro
目前可正式使用的版本,支援多模態推理、Vibe coding、100 萬 Token 長脈絡視窗,並在多項基準測試創新高:
• LMArena:1501 Elo,排名第一
• Humanity’s Last Exam:37.5%
• GPQA Diamond:91.9%(博士級科學推理)
• MathArena Apex:23.4%(高難度數學推理)
• MMMU-Pro / Video-MMMU 皆刷新多模態紀錄
Gemini 3 Deep Think
更偏向深度推理的模式,在最新測試中表現甚至超越 Pro,像 Humanity’s Last Exam 得分提升到 41.0%,未來將提供給 Google AI Ultra 訂閱者。
可學習、建構與規劃:更多實際應用
Gemini 3 支援跨文字、影音、圖片、影片和程式碼的輸入,例如:
• 解析手寫家族食譜 → 轉成可分享的電子食譜
• 看學術論文 → 產出單字卡、可互動圖表、可執行程式碼
• 分析球類運動影片 → 給出技巧與訓練建議

圖/翻攝 Google
在搜尋 AI 模式中,它能根據查詢即時生成視覺化介面。例如查「房貸比較」,Gemini 會直接做出客製化試算工具,而不是只給文字結果。
對開發者:更強的 Vibe coding 與代理能力
Gemini 3 在自動化開發與代理任務上全面升級:
• WebDev Arena:1487 ELO(第一)
• SWE-bench Verified:76.2%
• Terminal-Bench 2.0:54.2%
同時 Google 推出全新平台 Google Antigravity,讓開發者可以讓 AI 自主規劃開發任務、寫程式、跑終端、驗證結果,像是有一個「能自己寫完 App 的開發夥伴」。
Gemini 3 也在第三方平台上線,包括 Cursor、JetBrains、GitHub、Replit 等。
長程規劃:能做跨天、跨周的任務
透過跨應用操作與工具使用,Gemini 3 可協助:
• 排旅行
• 管理 Gmail 收件匣
• 多步驟工作流程
在 Vending-Bench 2 測試中,模型能模擬經營販賣機一年且保持策略一致,顯示其真能做「持續性決策」而不是短線反應。

圖 / AI產出
功能特色與技術優勢
• 多模態理解(Multimodal understanding)
Gemini 3 不僅處理文字,還能理解圖像、影片、音訊、程式碼等多種資料形式。
它支援「長脈絡視窗」——高達 100 萬個詞元 (tokens) 的輸入,使其可處理大型資料集、長篇文章或多媒體輸入。
範例:你可以上傳手繪草圖、設計版面、圖片等,Gemini 3 會自動 “看懂” 並將其轉成 HTML/CSS/JavaScript 程式碼。
• 推理能力顯著提升
1.Google 表示這是 “最頂尖的推理能力” 模型,設計來掌握深度與細微差異。
2.在多項基準測試中創下新高,顯示其在理解、分析、解決問題的能力上強於前代。
• 代理與編碼能力(Agentic & Vibe Coding)
1.Gemini 3 擁有更強的代理能力(agentic capabilities):能執行多步驟工作流程、使用工具、調用 API、甚至自動規劃任務。
2.針對開發者,它還加強了「Vibe Coding」能力:從提示到 UI、從草圖到互動程式碼轉換,都更加自動化、互動性更高。
• 整合 Google 生態系統與搜尋界面更新
1.Gemini 3 被同步導入到 Google Search AI 模式,搜尋界面會依你的查詢生成互動式、視覺化的回應,而不只是文字。
2.生成式 UI(Generative UI):當你提出複雜查詢時,系統可能直接生成圖表、互動模擬、工具或專屬回應版面。
• 安全與責任建構(Responsible AI)
Google 指出 Gemini 3 是該公司迄今「最安全的模型」,進行了最全面的安全評估。表現出「減少奉承式回答/強化對提示注入(prompt injection)的抵抗」「改善網路攻擊濫用的防護」。
影片來源:Google DeepMind