谷歌Gemini 3发布:AI从“回答问题”到“完成工作”的跨越

谷歌Gemini 3发布:AI从“回答问题”到“完成工作”的跨越

距离Gemini 2.5发布仅七个月,谷歌于2025年11月18日正式推出其最新一代人工智能模型——Gemini 3。这款模型不仅在多个行业基准测试中刷新纪录,更标志着谷歌在AI竞赛中的一次重大反击。

Gemini 3被谷歌称为其“迄今为止最智能的模型”,在发布当天即被集成至Google搜索、Gemini App及多个开发者平台,显示出谷歌加速AI商业化的决心。据官方数据,Gemini App目前已拥有超过6.5亿月活跃用户,AI Overviews的月活用户更是高达20亿。

三大核心突破:推理、编码与智能体能力

  1. 深度推理能力飞跃
    Gemini 3在LMArena排行榜上以1501分的历史最高分登顶,在通用推理测试Humanity’s Last Exam中获得37.5%的成绩,超越GPT-5 Pro的31.64%,展现出极强的逻辑与多步推理能力。
  2. 编码能力全面增强
    在代码生成方面,Gemini 3在WebDev Arena、Terminal-Bench 2.0、SWE-bench等多个专业测试中均取得领先成绩,尤其在“氛围编程”(Vibe Coding)和“代理式编码”(Agentic Coding)方面表现突出,支持从草图到代码的自动生成。
  3. AI智能体能力跃升
    Gemini 3不再只是被动响应指令,而是能自主规划、调用工具、执行复杂任务的“数字代理”。在模拟运营自动售货机的Vending-Bench 2测试中,它通过长程规划和工具使用实现更高回报,展现出独立完成工作流的能力。

新平台Antigravity:AI成为开发“合伙人”

为配合Gemini 3的发布,谷歌同步推出了全新开发平台Google Antigravity。该平台将AI智能体集成至编辑器、终端和浏览器中,使其成为开发者的“主动合伙人”,可自主完成从代码生成到部署验证的全流程。

DeepMind首席技术官Koray Kavukcuoglu表示:“智能体可以在你的编辑器、终端和浏览器之间协同工作,以最佳方式帮助你构建应用程序。”这标志着AI辅助开发从“工具”向“协作者”的根本转变。

市场反应与未来展望

Gemini 3的发布引发行业广泛关注,OpenAI CEO Sam Altman与xAI创始人Elon Musk均公开祝贺,显示出其在AI领域的分量。谷歌CEO Sundar Pichai则表示,Gemini 3的目标是让“任何想法都能变成现实”,推动AI从“回答问题”走向“完成任务”。

随着Gemini 3的全面上线,谷歌正加速将其AI能力渗透至搜索、办公、开发等核心产品线,进一步巩固其在AI生态系统中的主导地位。未来几周,Gemini 3将向更多用户开放,AI竞赛也将从“模型能力”转向“执行力”与“落地速度”的新阶段。